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本 书 专门 针对 Python 新 手 量 身 定 做 ， 涵 盖 Python 3 实际 开发 中 经 常用 到 的 重要 知识 点 ， 内 容 主要 包 
括 Python 语言 的 类 型 和 对 象 、 运 算 符 和 表达 式 、 编 程 结构 和 控制 流 、 函 数 、 序 列 、 多 线程 编程 、 正 则 表 
达 式 、 面 同 对 象 编程 、 文 件 和 目录 操作 、 网 络 编程 和 邮件 收发 、 数 据 库 编程 、Django 框架 和 项 目 范例 。 
在 介绍 知识 点 的 过 程 中 ， 实 现 了 理论 和 实践 相 结 合 。 书 中 还 安排 了 不 少 实践 示例 ， 以 帮助 读者 巩固 所 学 、 
学 以 致 用 。 

本 书 内 容 丰 富 、 结 构 合 理 、 思 路 清晰 、 语 言 简练 流畅 、 示 例 翔 实 。 本 书 主要 面向 Python 初学 者 ， 适 
合作 为 高 等 院 校 Python 程序 设计 课程 的 教材 ， 还 可 作为 Python Web 应 用 开发 人 员 的 参考 资料 。 

本 书 配 套 的 电子 课件 、 习 题 答案 和 实例 源 文件 可 以 到 http://www.tupwk.com.cvdownpage 网 站 下 载 ， 也 
可 通过 扫描 前 言 中 的 二 维 码 下 载 。 
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Python 是 一 种 解释 型 的 、 面 向 对 象 的 、 带 有 动态 语义 的 高 级 程序 设计 语言 。 在 使 用 Python 
时 ， 开 发 人 员 可 以 保持 目 己 的 代码 风格 ， 可 以 使 用 更 清晰 易 懂 的 程序 来 实现 想 要 的 功能 。 对 于 
一 个 没有 任何 编程 经 历 的 人 来 说 ， 既 简单 又 强大 的 Python 就 是 完美 的 选择 。 

随 着 云 计 算 、 大 数据 、 人 工 旬 能 等 技术 的 迅速 岂 起 ， 对 Python 人 才 的 迫切 需求 和 现实 中 
Python 人 才 的 贰 乏 让 长 期 沉默 的 Python 语言 一 下 子 备 受 大 众 关 注 ， 本 书 作为 教材 ， 可 以 说 是 应 
运 而 生 。 另 外 ，Python 2.7 己 逐 渐 成 为 历史 ，Python 3 已然 成 为 主流 版 本 ， 而 新 版 本 的 Python 
市 来 了 很 多 新 特性 。 本 书 基于 Python 3.7.1 编写 而 成 ， 满 足 了 想 学 习 和 了 解 Python 最 新 版 本 及 
其 特性 的 读者 。 

本 书 专门 针对 Python 新 手 量 身 定做 ， 是 编者 学 习 和 使 用 Python 过 程 中 的 体会 和 经 验 总 结 ， 
涵盖 实际 开发 中 的 所 有 重要 知识 点 ， 内 容 详 撤 ， 代 码 可 读 性 和 可 操作 性 强 。 

本 书 主要 介绍 Python 语言 的 类 型 和 对 象 、 运 算 符 和 表达 式 、 编 程 结 构 和 控制 流 、 函 数 、 订 
列 、 多 线程 编程 、 正 则 表达 式 、 面 向 对 象 编程 、 文 件 和 目录 操作 、 网 络 操作 和 邮件 收发 、 数 据 
库 编程 等 。 在 讲解 每 个 知识 点 的 时 候 ， 先 讲解 理论 ， 后 列举 实际 示例 ， 各 章 还 安排 了 习题 ， 以 
帮助 读者 将 所 学 应 用 到 实际 中 ， 做 到 学 以 致 用 。 

本 书 的 另 一 个 特色 是 , 使 用 通俗 易 异 的 描述 和 丰富 的 示例 代码 , 结合 日 常生 活 中 的 小 事件 ， 
是 高 本 书 的 可 读 性 ， 将 复杂 问题 简化 ， 使 学 习 Python 变 得 轻松 。 

本 书 共 分 14 章 ， 各 章 内 容 安排 如 下 。 

第 1 章 主要 介绍 Python 的 起 源 、 应 用 场合 、 前 景 以 及 Python 3 的 新 特性 。 

第 2 章 主要 介绍 Python 的 基础 知识 ， 为 后 续 章 节 学 习 相关 内 容 做 铺垫 。 

第 3 章 重 点 介绍 字符 和 序列 (列表 、 元 组 、 集 合 等 )。 

第 4 章 重 点 介绍 流程 控制 语句 ， 主 要 包括 分 文 结构 、 循 环 结构 。 

第 5 章 主要 介绍 正则 表达 式 。 

第 6 章 重 点 介绍 函数 。 力 数 是 组 织 好 的 、 可 重复 使 用 的 、 用 来 实现 单一 或 相关 功能 的 代 
码 段 。 

第 7 章 重点 介绍 面向 对 象 编 程 技 术 。Python 从 设计 之 初 就 是 一 门面 癌 对 象 的 语言 ， 提 供 了 

第 8 章 重点 介绍 模块 ， 从 import 语句 开始 介绍 ， 然 后 逐步 深入 。 

第 9 章 市 领 大 家 学 习 如 何 处 理 各 种 异常 和 错误 ， 以 及 创建 和 目 定 义 异 党 类 。 

第 10 章 重点 介绍 如 何 使 用 Python 在 硬盘 上 创建 、 读 取 和 保存 文件 ， 以 及 目录 的 创建 、 删 


第 11 章 主要 介绍 Python 多 线程 编程 。 

第 12 章 重 点 介绍 Python 数据 库 编程 ， 并 实现 简单 的 增删 改 查 操作 。 

第 13 章 重 点 介绍 Python 网 络 编程 。 

第 14 章 介 绍 如 何 使 用 Django 框架 创建 一 个 投票 管理 系统 ， 以 及 如 何 打 包 和 发 布 该 系统 。 

本 书 分 为 14 章 ， 其 中 言 林 财经 大 学 的 相 草 草编 写 了 第 1 一 8 章 ， 东 北 电力 大 学 的 孙 鸿 飞 纺 
写 了 第 9 一 14 章 。 另 外 ， 参 加 本 书 编写 的 人 员 还 有 耿 超 、 黄 果 、 李 琼 琼 、 王 德 学 、 刘 雄 、 林 希 
等 。 由 于 作者 水 平 有 限 ， 本 书 难免 有 不 足 之 处 ， 欢 迎 广大 读者 批评 指正 。 我 们 的 信箱 是 
huchenhao(@263.net， 电 话 是 010-62796045 。 

本 书 配 套 的 电子 课件 、 实例 源 文件 和 习题 答案 可 以 到 http://www.tupwk.com.cn/downpage 网 
站 下 载 ， 也 可 通过 扫描 下 面 的 二 维 码 下 载 。 


作 者 
2019 年 3 月 


] .1 


| By 


3 


1.4 


135 


1.6 
| | 


第 2 章 ”Python 语 言 基 础 
Python 语法 特点 
212 代码 规范 
本 


2.1 


2.2 


1.1.1 Python 起 源 ………… 
1.1.2 ”Python 版 本 -PP 
1.13 Python 应 用 -pe 
搭建 Python 开发 环境 


i ~ 


1.2.1 状 职 Bywihoa 


12.4 多 版 本 python 及 虚拟 环境 的 安装 … 
python 开发 环境 的 使 用 ………………… 
1.3.1 ”使 用 自 带 的 IDLE………………………… 
1.32 常用 的 第 三 方 开 发 工具 …………… i 
a .RN 


1.4.1 为 什么 提示 “Python 不 是 内 部 或 


外 部 命令 ee PO TO 


1.4.2 如 何在 Python 交互 模式 下 运行 


1.5.1 IDLE 的 简单 使 用 et 
15.2 pip 工 具 的 使 用 pp 


20 
22 


2 


2.4 


2 


2.0 


2-1 


2.8 


23.1 变量 定 潜 ee 
pe ee 
i 
PE aaaaoaoanuaa 
PW 
nn SE 


252 比较 运算 符 ……………… 
po 
pe 
256 成 员 运 算 符 ……………… 
pr 7 
25B 运 向 符 的 优先 绩 二 3 
2.6.1 使 用 mput0 函 数 输入 
2.62 使 用 printO 函 数 输 出 


下 了 下 求 平方 根 …………… i 


2.7.3” 求 术 和 仙 花 数 ……………… 


77 了 4 判断 素数 ee OC 


; 音 小 续 NN Ee 


ET ON 


第 3 章 

3 
计算 字符 申 的 长 度 -…………………………- 
字母 的 大 小 写 转换 …………………………… 


3.1.1 


3.1.2 


二 -下子 


3.1.4 


3.1.5 


3.1.6 


3.1.7 


3.1.8 


3.19 


3.2 序列 


3.3 列表 


3.3.6 


3.4 元 组 


3.4.1 


3.4.7 


2 


Ee 


字符 串 查找 CR 
ee 
统计 字符 出 现 次 数 …… 和 和 
去 除 字符 串 中 的 空格 和 特殊 字符 … 


序列 相 加 Te 
检查 某 个 元 素 是 否 是 序列 的 成 员 … 


计算 序列 的 长 度 、 最 大 值 和 


和 


ee 
访问 列表 元 素 -…… 
对 列表 元 素 进行 统计 ………………… 
寺 列 天 进行 排 认 
列表 推导 式 ………… 
元 由 的 创 随 eeeereeerrorrrreemon 
访问 元 组 元 素 -7 
元 组 与 列表 的 区 别 ……………………… 
35 字 曲 (ne 

5 的 侧 字 下 : 
i a 
修改 字典 ……… 


13 


3.0 


3 
3.8 
3.9 


第 4 章 
4.1 


42 


4.3 


4.4 
4.5 


3.] 


了 过 


3 二 的 丰 四 有 汗 is 
i 
3.6.1 集合 的 创建 …………………… 
3.62 ”和 集合 的 常用 操作 ………………… 
3 .63 ”集合 的 内 置 方法 
2 OE 


es 
I 
ES 
42.1 while 循 环 …………………… 
422 while 死 循环 ………… 
“94 
a OQ 


3% While ee 
42.4 for 循环 ……………… 
4.25 循环 控制 语句 


8] 
81 
82 
"和 


i %3 
i | 


80 
87 
89 
89 


91 
91 
91 
92 
加 
9 


i OQ3 


94 


.3 
90 
of 
97 


4.3.2 ”使 用 snaps 库 制作 数字 闹钟 ……………98 


td 
EE 


A 
nn: 
Ge 
re 模块 中 的 常用 功能 函数 ……… 
ia aa 
Gd 
et 
nt 


98 
0 


…101 


101 
101 
102 
103 


104 


104 
104 
105 
106 
106 


3 
5.4 
3.3 


第 6 章 
6.1 


0.2 


0.3 


0.4 


6.5 

6.6 

6.7 

6.8 
第 7 章 

7.1 


12 


二 
1.4 


ee 


6.2.1 


7 
函数 的 创建 和 调用 ………… 
6.1.1 创建 函数 ………………… 
6.1.2 ”调用 函数 ……………… 
A 
不 可 变 类 型 参数 和 可 变 类 型 参数 … 


6.3.2 ”返回 多 个 值 …………… 


64.1 全 局 变量 和 局 部 变量 ………………… 


6.4.2 ”global 和 Inonlocal 关 键 字 
匿名 函数 (lambda) ……… 
Collatz 厅 pl EA 
本 音 小 结 …… WO 


i 
和 
和 卓 


面向 对 象 概述 ………… 
7.1.1 面向 对 象 术语 简介 …… 


714 类 的 方法 a a 仆仆 放 攻 生 和 下 人 
深入 介绍 效 
7.2.1 类 的 构造 方法 …--……… 


T7237 匡 的 访问 权限 -=--------------- 


7.4.2 


给 汰 与 放 才 ee te 
7.4.1 类 的 单 继 基 ………………… 
类 的 名 继承 …-…-----……- 


743 ”构造 函数 的 继承 ………………… 


142 
145 
146 
146 
148 


15 
7.6 
7.7 
7.8 


= 


8.1 


8.2 


8.3 


8.4 


8.5 


8.0 
8./ 


第 9 草 
9.1 


744 方法 重 写 ……………… 


7.4.3 


es 
思考 与 练习 -……………. 


和 
8.1.1 
8.1.2 
8.1.3 
8.1.4 
8.1.5 


8.1.6 


模块 的 高 级 技术 …… 


.2.1 i 


python 中 的 包 ……………… 
i 
nn 
8.3.3” 包 的 组 织 …………… 


8.3.1 


8.3.2 


常用 内 建 模 抉 ……… 
8.4.1 
8.4.2 
8.4.3 
8.4.4 


8.4.3 


85.] 创建 模块 …-… te 


ET 


异常 处 理 和 程序 调试 …………… 


zt 


9.1.1 错误 与 异常 的 概念 


912 Python 内 置 异 常 I 


继承 下 的 名 态 EE 


7 
import 语 句 …………… 
es 
from.. .import 语 句 ………… 
ee 
安装 第 三 方 模块 ……………………… 


de 


ad 


i 162 


“165 
a 关 交 上 区 和 165 
“165 
166 
167 
168 


92 


3 


9.4 


9.5 
9.6 
9.7 


第 10 章 
10.1 


10.2 


10.3 


9.1.3 


9.1.4 


requests 模 块 的 相关 异常 …………… 
用 户 自 定 义 异 常 ph 全 人 相生 < 


异 稍 处 理 - 和 pe i 


92.1 


.2 


.13 


9.2.4 


9.2.5 


9.2.6 


| 


异常 中 的 else i 
异常 中 的 finally………………… 


使 用 raise 语 句 主 动 抛 出 异常 ……… 2 


使 用 traceback 模 块 查看 异常 ………… 


程序 调试 ……… 


9.3.1 


332 


90.3.3 


9.3.4 


9.3.5 


9.3.6 


ITIVE, 和 


ee 
运行 单元 测试 
9.4.3 ”setUp(0 与 tearDown0 方 法 ……… 
文档 测试 -0 
i 
RN 


目录 和 文件 操作 ……………--……… 
基本 文件 操作 
10.1.1 打开 和 关闭 文件 
i 
1 ee 


9.4.2 


基本 文件 方 广 ee 


10.23 序列 化 和 反 序 列 化 -pp 
和 
Et 
ES 
i103 蒜 卫 训 全 入 航 ee 


10.3.1 


10.4 
10.> 
10.6 


11.] 


]1.3 
1]1.4 


11.> 
11.6 
11.7 


119 


11.10 


12.] 


10.3.4” 重 命名 、 移 动 、 复 制 和 


i 
10.3.5 ”创建 和 删除 目录 …………………… 
ET 


EE 


第 11 草 ”多 线程 编程 
ee 
进程 
线程 -0 
11.13 包 进 程 和 名 线程 
a 
11.2.1 全 局 解释 器 销 ………… 
1122 退出 线程 
11.2.3 ”Python 的 线程 模块 ………………… 
thread 模 块 ………… i 
threading 模 块 -……………………… 
守护 线程 ……… 
Thread 对 象 ……………………… 
2 EE 
Queue 模 抉 …… 
11.7.2 计算 密集 型 与 IO 密集 型 ………………… 
1173 异步 TO -…………………… 
二 
裴 流 那 契 数列 、 阶 乘 和 加 和 …… 


11.1.1 


11.1.2 


11.4.1 


11.4.2 


11.7.1 


11.8.1 
11.8.2 ”使 用 队列 解决 生产 者 /消费 者 
11.8.3 
11.8.4 


11.8.5 


多 个 子 进程 间 的 通信 
本 童 小 结 SOE 
i 


第 12 章 ”数据库 编 程 …………… 
使 用 dbm 创 建 持久 字典 ………… 


…237 


2 


L233 


12.1.1 


12.1.2 


lz2.13 


12.1.4 


Se mn 
让 
ds 
dbm 与 关系 数据 库 的 适用 场合 … 


12.2.1 


12.2.2 


12.2.3 


使 用 Python 的 DB APT…………2 


12.3.1 


12.3.2 


12.3.3 


12.3.4 


12.3.3 


12.3.6 


SQL 语言 Si 
建 亲 煌 据 库 ed 


td 


下 载 DB API 模 块 Se 
ee 
数据 库 的 CRUD 操 作 ee 
使 用 事务 并 提交 结果 -…………… 
检查 模块 的 功能 和 元 数据 ……… 
处 理 错 误 和 


12.4 ”使 用 mysql-connector………………… 


过 > 
12.6 


13.1 
| 


12.4.1 


12.4.2 


12.4.3 


12.4.4 


12.4.3 


12.4.6 


12.4.7 


12.4.8 


12.4.9 


12.4.11 


12.4.12 


i 


更 新 数据 ………… 1 


删除 数据 表 -……… Ri 


ns 


Sm mn 
We RN 


TCP/ 焉 简介 
TCPI/IP 协 议 族 概述 ………… 
TE 


长 本 全 | 


13.2.2 


13.2.3 


13.2.4 


1329 


284 


13.3 


13.4 


二 


13.6 
13.7 


第 14 草 
14.1 


14.2 


14.3 


14.4 


14.5 


三 


13.3.1 Python 发 送 邮 件 …………… 
13.3.2 
13.3.3 ”Python 发 送 带 附件 的 邮件 
13.3.4 ”在 HTML 文 本 中 添加 图 片 


1 


Python 发 送 HTML 格 式 的 邮件 …… 


使 用 第 三 方 SMTP 服 务 发 送 ……… 


te 
13.4.1 通过 POP3 下 载 邮件 -…………………… 
ss 
7 


13.5.2 UDP 编 程 eS 
= 


Django 与 投票 管理 系统 … 


Web 框 架 的 基础 功能 …… 
Web 框 染 的 其 他 通用 功能 


14.1.1 


14.1.2 


Django 框架 的 安装 ……………………… 
14.2.1 ”Diango 框 架 的 特点 ………………… 
14.2.2 ”Django 框架 的 版 本 ………………………… 
14.2.3 在 Windows 下 安装 Django ………… 


使 用 Django 框 区 
143.1 创建 pvqi 项 目 
14.3.2 
14.3.3 


14.3.4 


项 目的 目录 结构 …………………… 
初步 配置 视图 和 urls…………… 


为 pyqi 项 目 创建 数据 库 ……………… 


14.4.1 


14.4.2 


14.4.3 


14.4.4 


14.4.3 


为 pyqi 项 目 配置 数据 库 ………… 
为 polls 应 用 创建 模型 …………… 
为 polls 应 用 激活 模型 ……………… 
测试 生成 的 模型 API …………… 


完善 投票 应 用 的 视图 …………… 


14.5.1 


14.3.2 


14.3.3 


14.3.4 


ep 
为 视图 添加 模板 …………………… 
ON 
抛 出 Http404 异 常 …………… 


录 


308 
308 
310 
31] 


14.6 


14./ 


14.8 


| WA 


144.$.3 get obj ect or 4040 a 


14.5.6 ”为 投票 应 用 使 用 模板 ………………… 
14.5.7 ”为 URL 名 称 添加 名 称 空间 ……… 
六 二 1 
14.62 通用 视图 ………………… 
管理 投票 应 用 的 静态 资源 …… 
14.7.1 自 定 义 应 用 界面 和 风格 ………… 
14.72 ”管理 静态 资源 …………… 
ns 
政要 后 音 表 靖 2 
14.82 改变 字段 列表 -PP 


Python 晕 础 教程 


14.8.3 ”改变 后 台 界面 和 风格 ……………… 
14.9 ”打包 和 发 布 投票 系 统 ……………… 
1491 重用 的 重要 性 -……………………………………… 
14.92 ”打包 项 目 和 应 用 -pp 
14.9.3 ”安装 和 印 载 自 定义 包 
ee 
14.10 本 音 小 绪 ……… 


第 1 草 


初 识 Python 


作为 本 书 的 开篇 ， 首 先 要 知道 ， 为 什么 要 学 习 Python 语言 ? 

Python 语言 伴随 人 工 智能 的 兴起 而 得 到 快速 莲台 的 发 展 。 

回顾 信息 技术 的 发 展 ， 移 动 互联 网 取代 PC 互联 网 领跑 在 互联 网 时 代 的 最 前 沿 ，Android 和 
iOS 一 度 成 为 移动 互联 网 应 用 平台 的 两 大 霸主 ,成 为 移动 开发 者 首选 的 两 门 技术 , HIMLS 以 其 
跨 平 台 优势 在 移动 互联 网 应 用 平台 占据 重要 位 置 ， 可 以 说 是 后 来 者 居 上 。 由 于 技术 的 限制 ， 难 
以 催生 出 更 多 的 新 应 用 ， 产 品 日 渐 饮 和， 移动 互联 网 从 题 峰 时 代 逐 渐 趋 于 平 组 发展。 那么 ， 下 
一 个 时 代 谁 是 主场 ? 下 一 门 应 用 技术 谁 来 掌 门 ? 

在 第 三 届 互 联网 大 会 上 ， 百 度 CEO 李彦宏 曾 表 述 : 靠 移动 互联 网 的 风口 己 经 没有 可 能 
出 现 “ 独 角 兽 ”了 ， 因 为 市 场 已 经 进入 一 个 相对 平稳 的 发 展 阶段 ， 互 联网 人 口 渗 透 率 已 经 超过 
50%。 未 来 的 机 会 在 人 工 智 能 领域 。 的 确 ， 互 联网 巨头 公司 在 人 工 智 能 领域 投入 明显 增 大 ， 都 
力争 做 人 工 智 能 时 代 的 “市 头 大 哥 ”。 

Python 作为 一 门 编程 语言 ， 其 魅力 甚至 超过 C#f、Java、C、C++， 被 称 为 “胶水 语言 ”， 
更 被 热爱 它 的 程序 员 誉 为 “最 优雅 的 ”编程 语言 。 从 云端 、 客 户 端 到 物 联 网 终端 ，Python 应 用 
无 处 不 在 ， 同 时 成 为 人 工 智能 首选 的 编程 语言 。 


本 章 的 学 习 目 标 : 

了 解 Python 语言 的 起 源 与 应 用 领域 ; 

剖 悉 Python 语言 的 版 本 、Python 的 获取 、Python 的 安装 和 局 动 ; 
了 解 Python 常用 的 开发 工具 ; 

熟悉 进行 Python 编程 的 几 种 方式 ; 

了 解 Python 初学 者 可 能 过 到 的 几 个 常见 问题 。 


Python 概述 


Python 是 一 门 鹭 平台、 开源、 免费 的 解释 型 高 级 动态 编程 语言 。 除 了 解释 执行 ，Python 还 
文 持 伪 编 译 ， 通 过 将 源 代码 转换 为 字 节 码 来 优化 程序 、 提 高 运行 速度 以 及 对 源 代码 进行 保密 ， 
并 且 文 持 使 用 py2exe、pyinstaller、cx_Freeze 或 其 他 类 似 工具 将 Python 程序 及 其 所 有 依赖 库 打 
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包 为 扩展 名 为 exe 的 可 执行 程序 , 从 而 可 以 脱离 Python 解释 器 环境 和 相关 依赖 库 而 在 Windows 
平台 上 独立 运行 ，Python 文 持 命令 式 编 程 、 函 数 式 编程 ， 完 全 文 持 面 同 对 象 程序 设计 。 也 有 人 
喜欢 把 Python 语言 称 为 “胶水 语言 ”， 因 为 Python 可 以 把 多 种 不 同 语言 编写 的 程序 融合 到 一 
起 实现 无 颖 拼接 ， 更 好 地 发 挥 不 同 语言 和 工具 的 优势 ， 满 足 不 同 应 用 领域 的 需求 。 

Python 官网 同时 发 行 并 维护 Python 2.x 和 Python 3xX 两 个 不 同系 列 的 版 本 。 这 两 个 系列 版 
本 之 间 很 多 用 法 是 不 兼容 的 。 在 选择 Python 的 时 候 ， 一 定 要 先 考虑 清楚 自己 学 习 Python 的 目 
的 是 什么 ， 打 算 做 哪 方面 的 开发 ， 有 哪些 扩展 库 可 以 使 用 ， 这 些 扩展 库 最 高 文 持 哪个 版 本 的 
Python， 等 等 ， 确 定 完 之 后 再 做 出 选择 ， 而 不 至 于 把 时 间 浪 费 在 Python 和 各 种 扩展 库 的 反复 安 
装 上 。 


1.1.1 ”Python 起 源 


1989 年 圣诞 节 期 间 ， 在 阿姆斯特丹 ，Guido van Rossum 为 了 打发 圣诞 节 的 无 趣 ， 决 心 开发 
一 种 新 的 脚本 解释 程序 ， 作 为 ABC 语言 的 一 种 继承 。 之 所 以 选择 用 Python 作为 名 字 ， 是 因为 
Guido 本 人 是 一 个 名 叫 Monty Python 的 喜剧 团体 的 爱好 者 。 

ABC 语言 是 由 Guido 参加 设计 的 一 种 教学 语言 。 就 Guido 本 人 看 来 ，ABC 这 种 语言 非常 
优美 和 强大 ， 是 专门 为 非 专业 程序 员 设 计 的 。 但 是 ABC 语言 并 没有 成 功 ， 究 其 原因 ，Guido 认 
为 是 其 非 开 放 性 造成 的 。Guido 决心 在 Python 中 避免 这 一 错误 。 同 时 ， 他 还 想 实现 在 ABC 语 
言 中 闪现 过 但 未 曾 实现 的 东西 。 

就 这 样 ，Python 在 Guido 手中 诞生 了 。 可 以 说 ，Pvython 是 从 ABC 语言 发 展 而 来 ， 主 要 有 党 
到 Modula-3( 男 一 种 相当 优美 且 强 大 的 语言 , 为 小 型 团体 而 设计 ) 的 影响 , 并 且 结 合 了 UNIX shell 
和 C 语言 的 使 用 习惯 。 

自从 2004 年 以 后 ，Python 的 使 用 率 呈 线性 增长 。2011 年 1 月 ，Python 在 TIOBE 编程 语言 
排行 榜 上 被 评 为 2010 年 度 语言 。 

由 于 Python 语言 的 简洁 性 、 易 读 性 以 及 可 扩展 性 ， 在 国外 用 Python 做 科学 计算 的 研究 机 
构 日 益 增 多 , 一 些 知名 大 学 已 经 采用 Python 来 教授 程序 设计 课程 。 例 如 卡 内 基 梅 隆 大 学 的 编程 
基础 、 厅 省 理工 学 院 的 计算 机 科学 及 编程 导论 就 使 用 Python 语言 讲授 。 众 多 开源 的 科学 计算 软 
件 包 都 提供 了 Python 的 调用 接口 , 例如 著名 的 计算 机 视觉 库 OpenCV、 三 维 可 视 化 库 VITK、 医 
学 图 像 处 理 库 ITK。 而 Python 专用 的 科学 计算 扩展 库 束 更 多 了 ， 例 如 如 下 三 个 十 分 经 典 的 科学 
计算 扩展 库 : NumPy、SciPy 和 matplotlib， 它 们 分 别 为 Python 提供 快速 数组 处 理 、 数 值 运 算 以 
及 绘图 功能 。 因 此 ，Python 语言 及 其 众多 的 扩展 库 所 构成 的 开发 环境 十 分 适合 工程 技术 、 科 研 
人 员 处 理 实验 数据 、 制 作 图 表 ， 甚 至 开发 科学 计算 应 用 程序 。 


1.1.2 Python 版 本 


Python 有 很 多 版 本 。 用 一 个 Python 版 本 编写 的 程序 未 必 与 用 另 一 个 Python 版 本 编写 的 程 
序 兼 容 。 不 过 ， 如 果 所 有 编程 人 员 都 使 用 相同 的 Python 上 版本， 那么 Python 允许 在 你 的 程序 中 
使 用 由 其 他 人 编写 的 程序 ， 这 可 以 节省 大 量 时 间 和 工作 。 

选择 Python 版 本 时 ， 归 结 为 选择 Python 2.7 版 本 还 是 Python 3X 版 本 (其 中 ，x 是 不 断 递 增 
的 编号 )。 
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e Python 2.7 版 本 (长 久 以 来 的 骨干 版 本 ) 无 疑 十 分 优秀 , 大 量 现 有 的 软件 都 使 用 Python 2.7 
版 本 。 如 果 使 用 Python 代码 库 执 行 特定 任务 ， 库 代码 很 可 能 是 Python 2.7 版 本 的 。 
e Python 3x 版 本 (后 起 之 秀 ) 也 十 分 优秀 ， 去 除了 很 多 令 人 混 请 的 语言 功能 。 
目前 看 来 ，Python 3.x 的 设计 理念 更 加 入 性 化 ， 全 面 普及 和 应 用 已 经 是 大 势 所 趋 。 本 书 的 
源码 基于 Python 3.7.1。 


1.1.3 “Python 应 用 


1. 常规 软件 开发 


Python 支持 函数 式 编程 和 面向 对 象 编程 ， 能 够 承担 任何 类 型 软件 的 开发 工作 。 因 此 ， 常 规 
的 软件 开发 、 脚 本 编写 、 网 络 编程 等 都 属于 标 配 能 力 。 

2. 科学 计算 

随 着 NumPy、SciPy、matplotlib 等 众多 扩展 库 的 开发 ，Python 越 来 越 适合 于 做 科学 计算 、 
绘制 高 质量 的 2D 和 3D 图像 。 和 科学 计算 领域 最 流行 的 商业 软件 MATLAB 相 比 ，Python 是 一 
门 通 用 的 程序 设计 语言 ， 比 MATLAB 所 采用 的 脚本 语言 的 应 用 范围 更 广泛 ， 有 更 多 的 扩展 库 
提供 支持 。 虽 然 MATLAB 中 的 许多 高 级 功能 和 工具 箱 目 前 还 是 无 法 替代 的 ， 不 过 在 日 常 的 科 
研 中 仍然 有 很 多 的 工作 是 Python 可 以 代劳 的 。 


3. 自动 化 运 维 

这 几乎 是 Python 应 用 的 自留地 ， 作 为 运 维 工程 师 首 选 的 编程 语言 , Python 在 自动 化 运 维 方 
面 已 经 深入 人 心 ， 比 如 Saltstack 和 Ansible 都 是 大 名 而 而 的 自动 化 平台 。 

4. 云 计 算 

开源 云 计 算 解 决 方案 OpenStack 就 是 基于 Python 开发 的 。 

5. Web 开发 

基于 Python 的 Web 开发 框架 很 多 ， 比 如 耳熟能详 的 Django， 还 有 Tomado、Flask。 其 中 ， 
Pythont+Django 架构 组 合 应 用 范围 非 闸 三 ， 开 发 速度 非常 快 ， 学 习 门 槛 低 ， 能 够 帮助 天 发 人 员 
快速 搭建 可 用 的 Web 服务 。 

6. 网 络 扑 虫 

也 称 网 络 蜘蛛 ， 是 大 数据 行业 中 获取 数据 的 核心 工具 。 没 有 网 络 爬 虫 自动 地 、 不 分 昼夜 地 、 
高 佑 能 地 在 互联 网 上 谍 取 免费 的 数据 ， 那 些 大 数据 相关 的 公司 恐怕 要 少 四 分 之 三 。 能 够 编写 网 
络 爬 虫 的 编程 语言 有 不 少 , 但 Python 绝对 是 其 中 的 主流 之 一 ， 其 Scrapy 爬虫 框架 应 用 非常 广泛 。 

7. 数据 分 析 

在 大 量 数 据 的 基础 上 ， 结 合 科 学 计算 、 机 器 学 习 等 技术 ， 对 数据 进行 清洗 、 去 重 、 规 格 化 
和 有 针对 性 的 分 析 是 大 数据 行业 的 基石 。Python 是 数据 分 析 的 主流 语言 之 一 。 
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8. 人 工 智能 


Python 在 人 工 智能 大 范畴 领域 内 的 机 器 学 习 、 神 经 网 络 、 深 度 学 习 等 方面 都 是 主流 的 编程 
语言 ， 得 到 广 谤 的 文 持 和 应 用 。 


搭建 Python 开发 环境 


在 主流 的 Windows、Linux、Mac 操作 系统 上 都 可 以 搭建 Python 开发 环境。 


1.2.1 获取 Python 


要 搭建 Python 开 肥 环境， 首先 必须 下 载 和 安装 相应 的 工具 。 所 需要 的 工具 可 免费 下 载 。 

(1) 可 以 到 www.python.org 下 载 安 装 包 。 

(2) 也 可 以 到 www.activestate.com 下 载 ActivePython 组 件 包 。ActivePython 是 对 Python 核 
心 和 币 用 模块 的 二 进 制 包装 ， 是 ActiveState 公司 发 布 的 Python 开发 环境 。ActivePyvthon 使 得 
Python 的 安装 更 加 容易 , 并 且 可 以 应 用 在 各 种 操作 系统 上 .ActivePython 包含 一 些 贡 用 的 Python 
扩展 ， 以 及 Windows 坏 境 下 的 编程 接口 。 如 果 是 Windows 用 户 ， 下 载 msi 包 安 装 即 可 ;如果 
是 UNIX 用 户 ， 下 载 targz 包 直 接 解压 即 可 。 

(3) Python 的 IDE 具体 包括 PythonWin、Eclipse+PyDerv 插件 、 Komodo、EditPlus、PyCharm 等 。 


1.2.2” 安 地 Python 


1. 在 Windows 操作 系统 上 安装 Python 
从 官网 的 Windows 发 行 版 本 列表 (https://www.python.org/downloads/windows/) 中 找到 需要 的 
安装 程序 ， 如 图 1-1 所 示 。 需 要 注意 的 是 ， 为 32 位 的 操作 系统 下 载 币 x86 字样 的 安装 包 ， 为 
64 位 的 操作 系统 下 载 带 x86-64 字样 的 安装 包 。 本 书 使 用 的 是 Python 3.7.1。 
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时 [本 昌 Python Software Foundation [US] htPs wwnw-PythonorgdcwnlcadsAawindews/ 


@ Python 


About Downloads Documentation Community SUccess Stories News Events 


Python 2 Downloads 2» Windows 


Python Releases for Windows 


画 Latest Python 3 Release - Python 3.7. 


本- 上 二 村 Pythan 2 Release = Puther 2,7,1: 


1-1 Python 下 载 页 面 
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单 击 Download Windows x86-64 executable installer 下 载 项 开始 下 载 ， 如 图 1-2 所 示 。 


回 ) pyYthon-3.7.1-am..exe 产 
已 下 过 20.4/25.0 MB， 还 需 ,. 


| 


图 1-2 下载 Python 3.7.1 


下 载 Python 安装 程序 后 ， 双 击 运 行 安装 程序 ， 初 始 界面 如 图 1-3 所 示 。 选 中 底部 的 Add 
Python 3.7 to PATH 复 选 枉 ， 然 后 单 击 mstall Now 按钮 。 系 统 可 能 要 求 确 认 对 系统 所 做 的 更 改 ， 


单 击 OK 按钮 接受 这 些 更 改 ， 进 入 安装 界面 ， 如 图 1-4 所 示 。 


Cy 户 [tmOT 


= 
2 


python 
windows 


python 


| | 
Install Python 3.7.1 (64-bit) 
Select Irstall Now to install Python with default settings, or choose 
Customize to enable or disable teatures. 
各 Install Now 
CAUseraLENOVO ApeData LocaN\Programa pythonmpyithon3r 
Includes ICLE pip aifd docurmentatian 
Creates shortcuts and file associations 
一 Customize installation 
Choose lacation and teatures 
Install launcher for all users (recommended) 
EA add Python 3.7 to PATH Cancel 
图 1-3 Python 安装 程序 的 初始 界面 
it Se 上. 
Setup Progress 
Installing: 
Python 3.7.1 Test Suite (64-bit) 
Cancel 


[en 
windows 


me Bk 


在 安装 过 程 的 最 后 ， 


yt 


me 


windows 


| 


图 1-4 Python 安装 界面 


将 看 到 如 图 1-5 所 示 的 界面 ， 单 击 Close 按钮 关闭 即 可 。 


Setup was successful 


SFPeaal thanks to Mark Hammond, without whose years of 
treely shared Windows expertise, Python for Windows would 
still be Python for DOS. 


New to Python? Start with the omline tutorial and 
ocumentlalion, 


See what's new in this release., 


Close 


1-5 ”安装 成 功 界面 


2. 在 Linux 操作 系统 上 安装 Python 


在 Linux 操作 系统 上 安装 Python 要 简单 得 多 , 这 里 以 Ubuntu Linux 为 例 . Python 在 Ubuntu 
下 有 两 种 常用 安装 方法 : 

e 通过 Ubuntu 官方 的 apt 工具 包 安 装 。 

e 通过 编译 Python 源 代 码 安 装 。 

例如 ， 采 用 apt 安装 方式 时 ， 输 入 以 下 命令 


sudo apt-get Install python3.7.1 


apt 将 Python 安装 包 下 载 到 本 地 并 目 动 进行 安装 .Python 被 默认 安装 到 usr/local/lib/python3.7 
目录 中 。 安 装 完毕 后 ， 可 以 直接 输入 python 命令 来 查看 Python 版 本 号 或 是 否 安装 成 功 。 


1.2.3 ”局 动 Python 


安装 成 功 后 ， 打 开 Windows 的 命令 提示 和 从 窗口， 输入 python 命令 ， 即 可 显示 当前 Python 
的 版 本 号 ， 并 进入 ia 交互 模式 ， 如 图 1-6 所 示 。 


| 丽 - | [ SET Ti 站 口 


Microsoft Windows [版 本 10, 0. 17134, 407] ~ 
(c) 2018 Microsoft Corporation。 保留 所 有 权利 ; 


C:\Users\LENOVO»python , 
Python 3.7.1 (V3. 7. 1:260ec2c368， Oct 20 2018, 14:57:15) [MSC v.1915 64 bit (AMDG4)] on win32 
Type help ， “copyright”, "credits” or "license” for more information. 


图 1.6 在 命令 提示 符 窗口 中 启动 Python 
在 Python 交互 模式 下 可 以 直接 输入 python 命令 并 执行 。 例 如 ， 输 入 以 下 命令 


>>> print("hello") 
hello 
>>> print("hello world") 
hello world 
> > 一 
>>>y-—4 
> XTYy 
* 
i = We as 
命令 提示 符 窗口 如 图 1-7 所 示 。 
A. 
C:\Users\LENOVO» py yt hon | 
Python 了 二 (tr3. Td 260ec2c36a， Dect 20 2018, 14:87 :15) [MSC v.1915 64 bit CAMD64)| on win32 
Type “hel p ， “Copy yright”, “credits” or "license” for more information. 
>>2 print( hellLo ) 
he lo 
»” print(’hello world”) 
hel1o waorld 
5 芝 二 起 
533 y= 和 
[py H+y 
i 
i 
i 


图 1-7 直接 输入 python 命令 执行 
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在 命令 提示 答 窗 口中 使 用 交互 模式 执行 python 命令 , 只 适合 用 于 测试 功能 。 当 关 闭 窗口 时 ， 
所 有 输入 的 命令 和 执行 结果 均 无 法 重 现 ， 因 此 ,对 于 一 些 需 要 重复 使 用 的 代码 ， 显 得 无 能 为 力 。 

因此 ， 本 书 使 用 有 DLE(nteegrated Development Leaming Environment， 集 成 的 开发 学 习 环境 ) 
来 讲解 Python 的 功能 ，IDLE 又 称 Eric Idle(Monty Python 剧组 的 一 位 成 员 )。 

Python 安装 成 功 后 ， 同 时 会 安装 IDLE。 在 Windows 的 【开始 】 沈 单 的 所 有 程序 中 可 以 找 
到 IDLE 的 启动 项 ， 如 图 1-8 所 示 。 单 击 DLE(Python 3.7 64-bit) 选 项 ， 打 开 IDLE 窗口 ， 如 图 1-9 


所 示 。 
| [总 Python 3.7.1 she 口 
| File Edit shell Debyug Options Window Help 
只 Python 3.7 " Python 3.7.1 {v3.7.1:260ec2c36a, Oct 20 2018, 14:57:15}) [MSC Y.1915 64 bit 
! (AMDG4) ] on winde , 
pe “help’, copyright’, “credits” or "license(})” for more information. 
BB IDLE {Python 3.7 64-bit) 
Python 3.7 (64-bit 
名 i ) 
es Python 3.7 Manuals (64-bit) 
二 Python 3.7 Module Docs (64-bit) 
| Ln: 3 cot 
图 1-8 IDLE 启动 项 图 1-9 IDLE 窗口 


在 IDLE 中 ， 可 通过 两 种 方式 与 Python 交互 : shell( 输 入 的 Python 命令 将 立即 执行 ) 或 文本 
编辑 器 (允许 创建 程序 代码 文档 ])。 当 今 的 几乎 所 有 操作 系统 都 支持 IDLE。 

在 Mac 或 Linux 操作 系统 中 ， 打 开 终 端 ， 输 入 idle， 按 下 Enter 键 即 可 。 

shell 内 有 引擎 ，IDLE 程序 包含 Python 引擎 。Python 引擎 运行 Python 程序 。 与 命令 提示 
和 从 窗口 一 样 ，IDLE Python Shell 也 可 以 执行 输入 的 Python 命令 ,将 它们 输入 Python 引擎 ， 然 
后 显示 结果 。 


1.2.4 ”多 版 本 Python 及 虚拟 环境 的 安装 


实际 开发 中 ， 有 可 能 需要 用 到 不 同 的 Python 版 本 或 版 本 库 ， 难 免 会 涉及 不 同 Python 版 本 的 
安装 以 及 不 同 扩展 库 的 安装 。 这 里 以 Windows 环境 为 例 , 介绍 多 版 本 Python 及 虚拟 环境 的 安装 。 


1. 多 版 本 Python 的 安装 


前 面 已 经 安装 了 Python 3.7.1， 这 里 介绍 一 下 Python 2.7.15 的 安装 。 
(1) 首先 从 Python 官网 下 载 i 2.7.15 的 安装 包 ， 然 后 双击 运行 ， 如 图 1-10 所 示 。 


时 


Select whether to Install Pythan 2.7.15 
(64=Bit) far all users of this computer: 
I Install for all users 
2 [nesia 有 l hust for me (not avalable on Windows Wista) 


python 


windows 
Bsck | Nent = Cancal | 


图 1-10 安装 Python 2.7.15 


(2) 选中 Install for all users 单 选 按钮 ， 然 后 单 击 Next 按钮 ， 打 开 安 装 路 径 设 置 界 面 ， 如 
图 1-11 所 示 。 


Select Destination Directory 


Phease salect a frectory fer thwe Pythen 2.7.15 (64-bit) 


+ Pythonz7 “|Up New 


python 


|E:\Program Fies'\Pythonza7 
windows 


< Back Cancal 
图 1-11 设置 安装 路 径 
(3) 单 击 Next 按钮 ， 打 开 安 装 列表 ， 从 中 可 以 看 出 ， 不 能 添加 路 径 到 系统 变量 ， 先 单 击 
Next 按钮 进行 安装 ， 后 面 再 专门 解决 ， 如 图 1-12 所 示 。 


哪 Python27.15 (64-b 


Customize Python 2.7.15 (64=bit) 


Select the Way you want features to be instaled. 
Chck on the icons in the trea belcw to change the Way 
fratures wa be installed. 


| Reglster Extensions 
| TdiTk 
"| Docurnentation 


室 -| Rtiliby Scripts 


BSL Sule 
区 hd pythorn.dmt to Path 


Python Intarpratar and Librarias 


python 


This feat ure requlres SOME on your hard drive, Tt has 
of? Eo 


时 6 subfaaturas selected. The subfeatures requlre 
WIN 0 OWS 32MB on Your Hard ive. 
Disk Usage Advanced <Bak | Net> | Cn | 


图 1-12 设置 系统 路 径 


(4) 单 击 Next 按钮 进入 安装 过 程 , 如 图 1-13 所 示 。 安装 完毕 后 , 单 击 Finish 按钮 完成 安装 。 
至 此 ，Python 3.7.1 和 Python 2.7.15 均 已 安装 完成 。 
别 Python 2.7.15 (64-bit) setup 


Install Python 2.7.15 (64-bit) 


Please Walt while th Irstaler rstalls Python 2,7,.15 (64-bit This may take 
Severa| MmiriUbes. 


Status: Publishing product information 


< Esck Next > 
图 1-13 ”安装 Python 2.7.15 


第 1 章 初 识 Python 


(5) 此 时 运行 cmd 命令 进入 DOS 命令 窗口 ， 输 入 python 命令 可 能 显示 Python 3.7.1 版 本 ， 
也 可 能 显示 Python 2.7.15 版 本 ， 这 很 可 能 是 环境 变量 中 Path 的 前 后 顺序 不 一 样 导 致 的 。 下 面 来 
设置 系统 环境 变量 。 

打开 【控制 面板 】| 【系统 和 安全 】| 【系统 】， 单 击 【 高 级 系统 设置 】， 如 图 1-14 所 示 。 


个 局 控制 面板 ” 系统 和 安全 》 系统 


控制 面板 主页 查看 有 关 计 算 机 的 基本 信息 


哪 设备 管理 器 Windows 版 本 
嘱 远程 设 定 Windows 10 家 庭 中 立 版 


畏 系统 保护 © 2018 Microsoft Corporation -二 WI 站 d OWS 1 () 


二 高 级 系统 设 百 。 保 留 所 有 权利 . 


系统 
处 理 器 : InteltR} CoretTh) i5-7200U CPU @ 2.50GHz a.70 


GHz 
已 安装 的 内 存 (RAM): 8.00 uB 


系统 类 型 : 64 位 操作 和 柔 统 ， 基 于 x64 的 处 理 器 
笔 和 甬 控 : 没有 可 用 于 此 显示 器 的 笔 或 前 入 输入 


技术 支持 信息 


”图 1.14 单 击 【高 级 系统 设置 】 
(6) 打开 【系统 属性 】 对 话 框 ， 单 击 【 环 境 变量 】 按 钮 ， 如 图 1-15 折 不 。 


| 系统 大 
计算 机 各 硬件 ”高 级 。 系统 保护 运程 
要 进行 大 完 数 更 改 ， 你 必须 作为 管理 员 登 录 .。 


性 能 
视觉 残 果 ， 处 理 器 计划 ， 内 存 使 用 ， 以 及 虚拟 内 存 


设置 ($)... 
用 户 配 各 区 件 
与 登录 帐户 相关 的 齐 面 设 吾 
| 
识 御 必 ).. 
启动 和 故障 恢复 
系统 启动 、 系 统 故 障 和 调试 信息 
设置 (T).. | 
| 
确定 取消 应 用 (A) 


| miosis | FT ed Tr TT TT 


图 1-15 单 击 【 环 境 变量 】 按钮 


(7) 打开 【环境 变量 】 对 话 框 ， 如 图 1-16 所 示 ， 在 【系统 变量 】 列 表 框 中 选择 Path， 然 后 
单 击 【编辑 】 按 钮 。 

(8) 单 击 【新 建 】 按 钮 ， 分 别 添 加 C:\Program Filesmython27 和 C:\Program Files\python27\ 
Scripts 到 环境 变量 中 ， 如 图 1-17 所 示 。 


Python 晕 础 教程 ~ 


LENOWD 的 用 尸 变量 仙 
变量 佑 
DneDrive CUsera\LENOVAON OneDrhe | 
Path CUsersLENOVMAppData\LocalPrograms\Python\ Pyihond ser.. 
| TERiP Csers\LE NOV AopData\LocahTermp 
TP CUeersLENOv Ap Data\LocalTermp 
新 建 ! 岂 ).. 编辑 (E).. 全 路 {0D) 
碌 统 窑 量 15) 
变量 晤 酚 
CormsPex CMMNDOW Naystemd cmd.axe 
contfigsetront CWNINDOWSN onfigsetRoont 
DriwerData Cndows ystem3a\Drivera, CriverDaia 


NUMBER OF PROCESSOQRS 4 


i CA Prog ram Flles traemntelydels ClhentucaProgranm Fllesrntelitl, 
PATHEXT .COMEXE BAT:.ChiDe VBS WBE: S.JSE:. WF WSH:. Se 


I FPFROCFESSOR ARCHITFEOTURE BhANEBA 
sa mo 
确定 职 消 


”图 1.16 【环境 变量 】 对 话 框 


| 人 [th 

| CMWindowsn System3a Wbem ”| | -新建 {NM) 
| CWindowsSystem3 a WindowsP owerShellyl .0 

| cAProgram Files m8eNInteN\Intel(R) Mlanagement Engine Compo... | | 


cProgram FilesintellnteltR) Management Engine Components,.. 
CAPrograim Files (x86NnteN\ ntellR) Management Engine Compea.. 


CProgram Files\InteRlntellR) Management Engine Components,.. 测 目 旧 - 
cProgram Files x86MNMNVIDIA CorporatiomP hy Commoan 
moystemhoot srstem3d2 | 型 除 ( 吕 
mystemhoot 
maystemhooti mystemd2 Wbem | 
WSYSTEMROOTYNSystem32\WindowsPowerShell\y1 .0\, | 上 柳 J 
,Dnodej 
| WSYSTEMROOTNSYystem32\0penSSH\ 下 移 (O) 


CNProgram Filen\hlongoD\ servent.Mbin 
CN\Program Filen\python3e 

| CProgram Filen\python36,scripts | 编 幅 浆 本 站}. 

| dProgram Fillesn\Anaconda3 | 

,dProgram Fles\Anaconda cripts 

| dProgram FileswAnaconda3wLibrarwbin 


ln 


cProgram Files\Python2r 
CAProgram Filen\PythonznN\ scripts mt 


确定 | 取消 


图 1-17 添加 路 径 


(9) 找到 Python 的 安装 目录 ， 修 改 python2.7.15 和 python3.7.1 了 于 目录 中 python.exe 和 
pythonw.exe 的 名 称 为 python2.exe、pythonw2.exe 和 python3.exe、pythonw3.exe。 

然后 运行 cmd 命令 ,输入 python2 即 可 运行 Python 2.7.15 版 本 ,输入 python3 即 可 运行 Python 
3.7.1 版 本 ， 如 图 1-18 所 示 。 


Ite) 2018 Microsoft Corporation。 晶 留 所 有 权利 上 
C:\Users LENOVO:python2 
Python 2,7.15 (v2,7,15:ca079a3ea3, Apr 30 2018, 16:30:26) [MSC v 1500 64 bit (CAMDG64)] on wins 


ECE: “Users\LENOVO2pythons 
Python 3.7.1 (v3.7.1:260ec2c36a, Oct 20 2018, 14:57:15) [MSC x. 1915 64 bit (MD64) |] on win32 | 
Type “help”, "copyright’, credits” or "license” for more information. 


六 六 六 


[ Tr = 一 一 天 


图 1-18 执行 python2 和 python3 命令 
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(10) Python 安装 包 需 要 用 到 包 管 理工 具 pip, 但 是 当 同 时 安装 多 版 本 Python 的 时 候 ，pip 只 
是 其 中 一 个 版 本 ， 以 下 将 提供 一 种 修改 方式 ， 重 新 安装 两 个 版 本 的 pip， 使 得 两 个 Python 版 本 
的 pip 能够 共存 。 

在 DOS 命令 窗口 中 输入 以 下 命令 


python3 -m pip Imstall --uperade pp --force-reinstall 
python2 -m pip mstal]l --uperade pip --force-renstall 


显示 重新 安装 成 功 。 需 要 注意 的 是 ，Python 2.7.15 的 pip 工具 需要 单独 安装 。 
2. Python 虚拟 环境 的 安装 


在 Windows 操作 系统 中 安装 Python 虚拟 环境 的 步骤 如 下 。 

(1) 首先 安装 virtualenv 镜像 ， 执 行 以 下 命令 : 

pip mstall virtualenv 

(2) 新 建 virtualenv， 例 如 新 建 一 个 名 为 scrapytest 的 虚拟 环境 : 

virtualenv scrapytest 

(3) 使 用 cd 命令 进入 \scrapytest\Scripts 目录 ， 直 接 输 入 activity 命令 执行 ， 进 入 虚拟 环境 ， 
如 图 1-19 所 示 。 进 入 虚拟 环境 ， 束 可 以 运行 Python 进行 测试 了 。 


NID LT 一 Tor- 十 - 一 二 一 ste 
I EY 加 


,Uasers LENOVO serapyteat“\Seripts»activate 


(serapytest) Ci\Usersa LENOVYO\ serapytest" Seripts2:python 
Python 3.7.1 (v3.7.1:260ec2c36a, Oct 20 2018, 14:57:15) [MSC v.1 


i (AMDG4) ] on WILD32 
三 四 bi 时 0 mr L 
,copryright”, “credits” or “license” for more inform 


图 1-19 进入 虚拟 环境 


(4) 当 安 装 有 多 个 Python 版 本 时 ， 可 以 更 改 虚 拟 环 境 的 Python 版 本 , 例如 ， 要 为 虚拟 环境 
更 改 Python 版 本 到 Python 2.7， 命 令 如 下 : 


virtualenv -p Ci\Python27'python.exe 
(5) 当 不 再 要 使 用 虚拟 环境 时 ， 可 以 退出 虚拟 环境 ， 执 行 以 下 命令 : 
deactrvate.bat 


(6) 如 果 虚 拟 环境 过 多 ， 管 理 起 来 会 不 太 方 便 。 可 以 使 用 专门 的 虚拟 环境 管理 包 
virtualenvwrapper 进行 管理 ，pip 安装 如 下 : 


pip Install virtualenvwrapper 
在 Windows 操作 系统 中 安装 如 下 : 


pip mstall virtualenvwrapper-wimn 


07) 安装 完毕 后 ,可 以 使 用 virtualenvwrapper 管理 虚拟 环境 ,这 时 新 建 虚拟 环境 的 命令 格式 
如 下 : 


mkvirtualenv virtual name 


例如 ， 新 建 一 个 名 为 py3scrapy 的 虚拟 环境 ， 如 图 1-20 所 示 。 


| Ce 
i I Wi nN “| 下 i 


| A 
Ci‘\Users\LENOVYO\scrapytest“Scripts»mkvirtualenv pydscrapy 
Using base prefix c:\\users\\lenovoW appdata\\local\\programs\\ 
python\\python37 
New python executable in C:\Users\LENOVYO\Envs\py3scrapy\Scripts' 
python. exe 
Installing setunptools, pip, wheel... 
done. 
(py3scrapy) C:\Users\LENOVO\scrapytest\Scripts» 

,| 


图 1-20 使 用 virtualenvwrapper 新 建 虚拟 环境 
(8) 要 碍 看 已 安装 的 虚拟 环境 ， 可 以 执行 workon 命令 ， 如 图 1-21 所 示 。 


国 CWINDOWS\system3a\cmd.exe 图 

oNe. A 
| 
| 


py3scrapy) C:\Users\LENOVO\scrapytest\Scripts>workon 


| 
Pass a name to activate one of the following virtualenvs: 


py3scrapy 
wirtual_name 


(py3scrapy) C:\Users\LENOYO\scrapytest\Scripts» 


图 1-21 查看 已 安装 的 虚拟 环境 


Python 开发 环境 的 使 用 


“ 工 欲 善 其 事 ， 必 先 利 其 器 。” 学 习 Python 语言 也 一 样 ， 熟 悉 开发 环境 是 学 习 
言 的 第 一 步 、 


1.3.1 ”使 用 自 市 的 IDLE 


IDLE 是 Python 的 官方 标准 开发 环境 , 从 官方 网 站 www.python.org 下 载 并 安装 合适 的 Python 
版 本 之 后 ， 也 就 同时 安装 了 IDLE。 相 对 于 其 他 Python 开 肥 环境 而 言 ， IDLE 比较 简单 ， 但 具备 
Python 应 用 开发 的 几乎 所 有 功能 ， 无 须 进行 复杂 配置 ， 界 面 如 图 1-22 所 示 。 
蝇 Python 3.7.1 sh 一 口 


File Edit $hell Debug Options Window Help 


Python 3.7.1 (v3.7.1:260ec2c36a, Oct 20 2018, 14:57:;15)} [MSC v.1915 64 bit (AM 
D64)] on win32 ee ey 
Type help ， copyright , credits or license(}) for more information. 


门 编程 语 


Ln: 3 Col:4 


1-22 Python 3.7.1 IDLE 的 界面 
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1.3.2 ”常用 的 第 三 万 开发 工具 


除了 默认 安装 的 IDLE, 还 有 大 量 的 其 他 IDE 开 发 环境 ,例如 wingIDE、PyCharm、PythonWin、 
Eclipse、Spyder、IPython、Komodo 等 。 严 格 来 说 ， 所 有 这 些 开 发 环境 都 是 对 Python 解释 器 
python.exe 的 封装 ， 核 心 是 完全 一 样 的 ， 只 是 加 了 外 挂 而 已 ， 使 用 起 来 方便 ， 减 少 了 出 错 率 ， 
尤其 是 拼写 错误 。 以 PyCharm 为 例 ， 界 面 如 图 1-23 所 示 。 


Wl pyproject [Dpyproject] - .Mtest. , I LMarm 柄 
File Edit View Navigate tode Refactor Run JTools YVES Window Help 
pyproject ; fa test.py ， 


是 Project = 辣 三 | 于 一 | 也 testpy a! 
| 三 pyproject Dpyprojed J printh hello morld S | 
|= > Venw 要 | 
: | ] 

= test_ py | 
» MllExternal Libraries 号 | 

四 | > pcratchesand Consoles 加 | 

EE 

和 区 

坚 名 

让 

二 

摆 

司 

Se 

三 

LA 

Fl 

嘱 Pythonconsole 国 Terminal 匡 5Debug 过 让 TODD 国 Event Log 
OD Low Memory: The IDE is running low on memory and this might afiect performance. Pleas_ (3 minutes ago) 1:21 ma UTF-8# 入 县 | 


图 1-23 ”PyCharmm 开发 环境 


1.3.3 ”官网 交互 式 环 境 


如 果 暂 时 什么 都 不 想 安装 ， 只 是 简单 地 想 试 试 Python 好 不 好 ， 可 以 试 试 Python 官方 网 站 
(www.python.ore) 提 供 的 Interactive Shell。 登 录 Python 官方 网 站 后 ， 单 击 图 1-24 所 示 方 框 内 的 
那个 图 标 ， 稍 等 片刻 即 可 进入 如 图 1-25 所 示 的 界面 。 


Ee Weleorme to Pythan 站 [可 溉 十 


二 本 Python Software Foundation [US] | https//Wwww.pythonorg = a [和 | 


Pythan 


@ PUthon 


About Downloads Documentation Community SUCcess Stories News Events 


a Quick & Easy to Learn 
让 
Experienced programimers In any other language can plek up 


Hello, I'm Python! . , 
- : Pythen very guickly, and beginners find the clean syntax and 
Indentation structure easy to learn. Whet your appetite with 


Sur Python 3 overy Ie, 


Python is a programming language that lets you work quickly 


and integrate systems more effectively, »» Learn More 


Welcome to Pythan.arg 里 路 


之 县 Python Software Foundation [US] | https:// mwa python.org 贸 方 全 O 


Python PSF 


puUthon o、 seach | E60 socialize 


About Downloads Documentation Community SUCcess Stories News Events 


Python 3.7 .0 (default, Aug 22 2018, 20:350:05) 

[SCE 5.4.0 20160609] en 11nux 

Type help , copyright , credits or license for more TnformatTon 
>>> print(t hello ) 


hal le 


Online console from PythonAnmwwhere 


图 1-2$ Python 官方 网 站 提供 的 Interactive Shell 界面 


注意 : 
如 果 想 尝试 一 下 在 安 车 手机 上 编写 Python 程序 ， 可 以 安装 支持 Python 3X 的 QPython 3 或 
者 支持 Python 2X 的 QPython。 


1.4.1 为 什么 提示 “'python' 不 是 内 部 或 外 部 命令 ……” 


己 经 安装 了 Python， 但 是 在 DOS 命令 窗口 中 运行 python 命令 时 却 提 示 “python 不 是 内 部 
或 外 部 命令 ， 也 不 是 可 运行 的 程序 ”。 

原因 : 在 环境 变量 中 未 给 Path 添加 值 。 

解决 办 法 : 打开 环境 变量 ， 为 系统 变量 中 的 Path 变量 添加 Python 安装 路 径 ， 假 如 Python 
的 安装 路 径 为 C:\Program Filespython37， 怠 将 这 个 路 径 添 加 到 系统 环境 变量 中 (参照 前 面 1.2.2 
节 的 操作 方法 )， 然 后 再 运行 python 命令 即 可 。 


1.4.2 ”如 何在 Python 交互 模式 下 运行 .py 文件 


要 运行 已 经 编写 好 的 .py 文件 ， 可 以 单 击 【开始 】 沫 单 ， 在 【搜索 程序 和 文件 】 文 本 框 中 输 
入 完整 的 文件 名 (包括 路 径 )。 例 如 ， 要 运行 Di\ceshipy 文件 ， 可 以 使 用 下 面 的 代码 : 


python3 D':\ceshipy 
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在 运行 py 文件 的 时 候 ， 如 果 文 件 名 或 路 径 比 较 长 ， 可 以 首先 在 命令 窗口 中 输入 python 加 
一 个 空格 ， 然 后 直接 把 文件 拖 放 到 衬 格 的 位 置 ， 这 时 文件 的 完整 路 径 将 显示 在 空格 的 右 侧 。 最 
后 按 下 Enter 键 运行 即 可 。 


1.5.1 IDLE 的 简单 使 用 


本 市 采用 标准 的 IDLE 作为 天 发 环境 来 演示 Python 的 强大 功能 ， 几 乎 所 有 代码 都 可 以 直接 
拿 到 其 他 开发 环境 中 运行 ， 不 需要 做 任何 修改 。 有 时 候 可 能 需要 同时 安装 多 个 不 同 的 版 本 ， 例 
如 ， 同 时 安装 Python 2.7 和 Python 3.7， 并 根据 不 同 的 开发 需求 在 两 个 版 本 之 间 切 换 。 多 版 本 并 
存 并 不 会 影响 在 IDLE 环境 中 直接 运行 程序 ， 只 需要 启动 相应 版 本 的 IDLE 即 可 。 在 命令 提示 
符 环境 中 运行 Python 程序 时 ， 在 调用 Python 主 程序 时 指定 其 完整 路 径 ， 或 者 修改 系统 环境 变 
量 Path 来 实现 不 同 版 本 之 间 的 切换 (Path 系统 环境 变量 的 修改 方法 参考 前 面 的 内 容 )。 

如 果 能 够 熟练 使 用 开发 环境 提供 的 一 些 快捷 键 ， 可 以 大 幅 提升 开发 效率 。 在 IDLE 环境 中 ， 
除了 撤销 (Ctl+2)、 全 选 (Ctl+A)、 复 制 (Cal+C)、 粘 贴 (CulHV)、 剪 切 (Ctl+X) 等 常规 快捷 键 之 外 ， 
其 他 比较 常用 的 快捷 键 如 表 1-1 所 示 。 


表 1-1 IDLE 中 的 常用 快捷 键 


快捷 键 功能 说 明 
Tab 补 全 单词 ， 列 出 全 部 可 选单 词 供 选 择 
AltHP 浏览 历史 命令 (上 一 条 ) 
AltHN 浏览 历史 命令 (下 一 条 ) 
CtrlLHF6 重启 Shell， 之 前 定义 的 对 象 和 导入 的 模块 全 部 失效 
Fl 打开 Python 帮助 文档 
AltH/ 自动 补 全 前 面 曾经 出 现 过 的 单词 ， 如 果 之 前 有 多 个 单词 具有 相同 的 前 级 ， 则 在 多 
个 单词 间 循 环 切换 
Ctrl+H] 缩 进 代码 块 
CtrlHH[ 取消 代码 块 缩 进 
Alt+3 注释 代码 块 
Alt+4 取消 代码 块 注释 


启动 Python 之 后 默认 处 于 交互 模式 ， 直 接 在 Python 提示 符 “>>>” 的 后 面 输入 相应 命令 并 
按 Enter 键 执 行 即 可 ， 如 果 执行 顺利 ， 立 即 可 以 看 到 执行 结果 ， 否 则 会 提示 错误 信息 并 抛 出 异 
常 ， 例 如 : 


| # 并 号 为 注释 符 ， 后 面 的 内 容 不 会 被 执行 
3 

>>> import math # 导 入 Python 标准 库 math 

>>> math.sqrt(25) # 使 用 标准 库 函 数 sqrt 计算 平方 根 


5.0 


>>> 3**7 # 使 用 ** 计 算 虹 运算 

9 

>>> 3*(1+9) 

30 

> > # 除 0 错误 ， 会 抛 出 异常 


Traceback (most recent call last): 
File "<pyshell#$>", Ine 1, m <module> 


2/0 
ZeroDIVISIOnEITOT division by zero 
>>> x=hello # 语 法 错误 ， 字 符 串 的 末尾 缺少 一 个 单 引号 


SyntaxError: EOL whlle scannme strine literal 
从 以 上 代码 可 以 看 出 ， 交 互 模式 一 般 用 来 实现 一 些 简 单 的 业务 逻辑 ， 或 者 验证 某 些 功能 。 
复杂 的 业务 逻辑 更 多 的 是 通过 编写 Python 程序 来 实现 ， 同 时 也 方便 代码 的 不 断 完 善 和 重复 利 
用 。 在 IDLE 界面 中 使 用 菜单 File | New File 创建 一 个 程序 文件 , 输入 代码 并 保存 为 文件 (务必 保 
证 扩展 名 为 py， 如 果 是 GUI 程序， 扩展 名 为 pyw)。 人 然后， 使 用 菜 捍 Run | Run Module 运行 程 
序 ， 程 序 运行 结果 将 直接 显示 在 IDLE 交互 界面 中 。 例 如 ， 假 设 程序 文件 testl.py 的 内 容 如 下 : 
def maim(): 
print("this 1s a test program") 
mam() 
在 IDLE 环境 中 运行 后 ， 显 示 如 下 : 
RESTART: D:/pyproject/testl .py 
this 1s a test program 
在 命令 提示 符 环境 中 运行 的 方法 和 结果 如 图 1-26 所 示 。 
CWINDOWS system3ac,. | 


] 有 
D:\pyproject»>python3 testl. py 
this is a test program 
DD: \pyproject> 
| 
Ml 


图 1-26 在 命令 提示 符 环境 中 运行 程序 


技巧 : 

为 提高 代码 的 运行 速度 ， 以 及 对 Python 源 代码 进行 保密 ， 可 以 在 命令 提示 符 环境 中 使 用 
python3 -OO -mpy compile file py 命令 将 Python 程序 fle py 伪 编 译 为 pyc 文件 , 选项 -OO 表示 
优化 编译 。 


1.5.2 pip 工具 的 使 用 


Python 语言 中 有 三 类 库 : 内 置 库 、 标 准 库 和 扩展 库 。 其 中 ， 内 置 库 和 标准 库 在 Python 安装 
成 功 后 即 安 装 。 内 置 库 不 需要 使 用 import 命令 导入 陈 能 直接 使 用 ; 标准 库 和 扩展 库 需 要 先导 入 


EE 
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才能 使 用 。 扩 展 库 主 要 通过 pip 工具 来 管理 。 
使 用 pip 工具 之 前 需要 得 看 是 否 可 用 ， 打 开 命 令 提示 符 环 境 ， 输 入 pip， 如 图 1-27 所 示 。 
如 果 pip 工具 不 能 使 用 , 检查 Python 的 安装 目录 , 找到 安装 目录 中 的 pip.exe 这 个 文件 ， 然 后 添 
加 到 系统 环境 变量 Path 中 ， 重 启 再 试 。 
国 CWINDOWS\system32\cmd exe 
Microsoft Windows [版 本 10,0,17134. 407] ~ 
(ce) 2018 Microsoft Corporation。 保留 所 有 权利 . 
C:\Users“\LENOYO»pip 


Usage: 
pip <commandy [options] 


Commands: 


install Install packages. | 

download Download packages. | 
| uninstall Uninstall packages., | 
| freeze Dutput installed packages in reoquirements format. | 

]ist List installed packagses. | 
| show Show information about inatalled packages. 


| -yy, —vYerbose 


-VC—version 
-9 quilet 


Give more output. OQption is additive, and can be Used up to 3 times. 
Show version and exit. 
Give less output. Option is additive, and can be used up to 3 times (corresponding to 


chack Verify installed packages have compatible dependencies. | 
| config Manage local and global configuration. | 

search search PyPl for packages. | 
| wheel Build wheels from your reguirements. | 
| hash Compute hashes of package archives. | 

completion A helper command used for command completion. | 

help Show help for commands. | 
Genaeral Options: 

-h, —help Show help. 

—isolated Run pip in an isolated mode, igsnoring environmeant variabless and user configuration, 


WARNING, ERROR, and CRITICAL logging levels). i 


图 1-27 pip 工具 


常用 的 pip 命令 如 下 。 

e Dip list 查看 已 安装 的 扩展 库 。 

e pip install package name: 安装 名 为 package name 的 扩展 库 。 

e Dip uninstall package name: 秋 载 名 为 package name 的 扩展 库 。 
例如 ， 使 用 pip 工具 安装 pandas 库 ， 如 图 1-28 所 示 。 


Li 让 pr 
i 1 i 
LT 4 l Ci 


—n0—color 


stem3a cmd .ey pip3 install pandas 


Suppress colored output 


‘NUsers“LENOVO»pipd install pandas 
‘llecting Danmdas 
Downloadine https: /files. pythonhosted., org/packages/ 58/a8,/03e5feQedbc522e46 
b27df2abfb42668141292653d8462f38bc704ai6a2a/ pandas-0. 23, 4-cp37-cp37m win_amd6 
. whl 7. 9MB) 
0% A0kKB 18kB/s eta 0:07:14 


图 1-28 安装 pandas 库 


本 章 小 结 


本 章 作 为 开篇 ， 首 先 介 绍 了 Python 语言 的 起 源 、Python 的 主流 版 本 、Python 语言 的 应 用 领 
域 . Python 是 一 门 胶 水 语言 , 主流 版 本 为 Python 2.x 和 Python 3.x, 其 中 后 者 为 大 势 所 趋 . Python 
语言 目前 主要 用 于 软件 开发 、 科 学 计算 、 目 动 化 运 维 、 云 计算 、Web 开发 、 网 络 怜 虫 、 数 据 分 
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析 和 人 工 智 能 等 领域 。 

在 使 用 Python 语言 之 前 , 需要 先 搭 建 Python 开发 环境 .到 Python 官方 网 站 www.python.org 
下 载 匹配 操作 系统 的 安装 包 ， 一 键 安 装 即 可 。 需 要 注意 的 是 同一 台 计 算 机 上 多 版 本 Python 的 安 
装 ， 以 及 Python 虚拟 环境 的 安装 和 管理 。 

对 于 Python 语言 的 使 用 ， 可 以 在 官网 的 交互 式 环境 中 测试 Python 语言 的 执行 ， 也 可 以 在 
命令 提示 符 环境 中 或 DLE 的 交互 模式 下 执行 Python 语句 ， 还 可 以 在 IDLE 或 专门 的 IDE 环境 
中 创建 Python 程序 ， 然 后 执行 Python 程序 。 

初学 者 最 容易 遇 到 的 问题 是 筷 记 设置 Path 系统 环境 变量 。 

pip 工具 主要 用 来 管理 Python 扩展 库 ， 可 以 用 来 查看 已 安装 的 扩展 库 、 安 装 扩展 库 以 及 利 
载 扩 展 库 等 。 所 安装 的 扩展 库 在 程序 中 使 用 时 ， 需 要 先 用 import 命令 导入 。 


思考 与 练习 


. Python 语言 的 主流 版 本 及 应 用 主要 有 哪些 ? 

. 请 实践 在 Windows 操作 系统 上 搭建 Python 开发 环境 。 

.如 何在 Windows 操作 系统 上 安装 多 版 本 Python? 

,加 何 安 装 Python 虚拟 环境 ? 

. 如 何在 IDLE 中 创建 Python 程序 并 执行 ? 

. 如何 通过 pip 工具 安装 扩展 库 ， 以 及 如 何在 Python 程序 中 使 用 扩展 库 ? 
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第 1 章 介 绍 了 Python 语言 的 版 本 、 环 境 安装 、IDE 使 用 等 。 有 了 环境 之 后 ， 下 面 就 来 学 习 
如 何 使 用 Python 语言 进行 编程 。 

学 习 任 何 一 门 语言 ， 首 先 要 了 解 该 语言 的 规范 、 变 量 、 对 象 、 数 据 类 型 、 表 达 式 等 ， 这 是 
任何 掌握 一 门 语言 的 基础 ，Python 语言 也 不 例外 。 因 此 ， 本 章 就 来 介绍 这 些 内 容 。 


本 章 的 学 习 目 标 : 

e 了解 Python 语言 的 语法 特点 ， 包 括 注 释 、 代 码 规范 ; 

e 剖 悉 Python 语言 的 保留 字 ， 了 解 Python 标识 符 的 命名 要 求 ; 

e 了 解 Python 变量 的 使 用 ; 

e 族 悉 Python 基本 数据 类 型 ， 包 括 数字 类 型 、 字 符 串 类 型 、 布 尔 类 型 ， 并 掌握 查看 数据 
类 型 的 方法 ; 


e 熟练 使 用 Python 运算 符 ， 包 括 算术 运算 符 、 赋 值 运算 符 、 比 较 运 算 符 、 逻 辑 运 算 符 、 
位 运算 符 ， 掌 握 运算 符 的 优先 级 ; 
e 熟悉 基本 输入 输出 函数 的 使 用 ， 包 括 input0、print0 函 数 。 


Python 语法 特点 


在 开发 过 程 中 ， 必 须 有 一 种 良好 的 方式 ， 使 他 人 更 易于 理解 自己 编写 的 代码 。 这 种 方式 就 
是 为 代码 添加 注释 。 

Python 中 的 注释 有 多 种 ， 有 单行 注释 、 批 量 多 行 注释 、 文 档 注释 ， 男 外 中 文 注释 也 很 常用 。 
注释 可 以 起 到 备注 的 作用 ， 在 进行 团队 合作 的 时 候 ， 个 人 编写 的 代码 经 常会 被 多 人 调用 ， 为 了 
让 别人 能 更 容易 理解 代码 的 用 途 ， 使 用 注释 是 非常 有 效 的 。 

另外 ， 良 好 的 编程 习惯 从 遵循 代码 规范 开始 。 对 于 一 份 漂亮 的 Python 程序 ， 首 先 要 符合 
Python 代码 规范 。 
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2.1.1 注释 


1. 单行 注释 

在 Python 中 ， 井 号 ( 雁 常 被 用 作 单 行 注释 符号 。 在 代码 中 使 用 # 时 ， 它 右边 的 任何 数据 都 会 
被 忽略 ， 被 当 作 注释 。 例 如 : 

print 1 # 输 出 1 

井 与 右边 的 内 容 “ 输 出 1” 在 执行 的 时 候 是 不 会 被 输出 的 。 

2. 批量 多 行 注释 

Python 中 也 可 以 对 多 行 代码 进行 注释 , 使 用 Python 提供 的 批量 多 行 注释 符号 即 可 。 批量 多 
行 注 释 用 三 对 单 引 号 或 双 引 号 包含 ， 位 于 三 对 引号 之 间 的 所 有 内 容 均 被 视 为 注释 。 例 如 : 


三 对 单 引号 ，Python 多 行 注 释 符 
三 对 单 引号 ，Python 多 行 注 释 符 


了 


三 对 双 引 号 ，Python 多 行 注释 符 
三 对 双 引 号 ，Python 多 行 注 释 符 
三 对 双 引 号 ，Python 多 行 注 释 符 


3. 中 文 注释 

在 使 用 Python 编程 时 ， 免 不 了 会 出 现 或 用 到 中 文 ， 这 时 候 需 要 在 文件 开头 加 上 中 文 注 释 。 
比如 创建 一 个 Python list, 在 代码 上 和 面 注释 上 它 的 用 途 , 如 果 开 头 不 声明 保存 编码 的 格式 是 什么 ， 
那么 它 会 默认 使 用 ASCI 码 保存 文件 ， 这 时 如 果 代 码 中 有 中 文 ， 就 会 出 错 ， 即 使 中 文 是 包含 在 
注释 里 面 的 。 所 以 ， 加 上 中 文 注释 很 重要 。 例 如 : 

#codine—utf-8 

或 者 : 

#codine=gbk 

以 上 两 种 形式 都 可 以 代表 中 文 注释 ， 推 荐 使 用 utf-8。 

作为 一 名 优秀 的 程序 员 ， 为 代码 加 注释 是 必须 要 做 的 。 但 要 确保 注释 所 说 的 都 是 重要 的 事 
情 ， 对 于 看 一 眼 束 知道 是 干什么 的 无 用 代码 是 不 需要 加 注释 的 。 
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4. 文档 注释 


作为 文档 的 docstring( 文 档 字 符 串 ) 一 般 出 现在 模块 、 函 数 和 类 的 头 部 ， 这 样 在 Python 中 束 

可 以 通过 对 象 的 _doc 对象 获取 文档 。 编 辑 器 和 IDE 也 可 以 根据 docstring 给 出 目 动 提示 。 文 
档 注释 主要 有 以 下 几 种 情况 。 

e ”文档 注释 以 "开头 和 结尾 ， 首 行 不 换行 ， 如 有 多 行 ， 末 行 必须 换行 ， 以 下 是 Google 的 
docstring 风格 示例 : 


-*- Codine: utf-8 -*- 
"Example docstrines. 
This module demonstrates documentation as specified by the ‘Google Python 
style Gulde”. Docstrmes may extend over multiple lmes. Sections are created 
with a section header and a colon followed by a block of ndented text. 
Example: 
Examples can be glven usine elther the ‘Example ”or Examples™ 
sectlons. Sections support any reStructuredText formatting. ncludme 
literal blocks:: 
$ python example google.py 
Section breaks are created by resumine unmdented text. Section breaks 
are also 1mplicitly created anytime a new section starts. 


针 于 中 下 和 


e 不 要 在 文档 注释 中 复制 函数 原型 ， 而 是 要 描述 具体 内 容 ， 解 释 具 体 参 数 和 返回 值 等 ， 
例如 : 


# 不 推荐 的 写法 (不 要 写 函 数 原型 ) 
def function(a, b): 
"foncton(a b) -> list™"™" 


# 正确 的 写法 
def function(a., b): 
"计算 并 返回 a 到 b 范围 内 数据 的 平均 值 "" 


e 对 国 数 的 参数 、 返 回 值 等 的 说 明 采 用 NumPy 标准 ， 如 下 所 示 : 


def func(argl, are2): 
"在 这 里 写 函数 的 一 句 话 总 结 (如 : 计算 平均 值 ) 
这 里 是 具体 描述 
参数 
argl : mt 
argl 的 具体 摘 述 
arg2 : mt 
arg2 的 具体 描述 
返回 值 


Python 晕 础 教程 ~ 


A 


mt 
返回 值 的 具体 摘 述 
参看 


otherfimc: 其 他 关联 函数 等 
示例 


示例 使 用 doctest 格式 , `>>>` 后 面 的 代码 可 以 被 文档 测试 工具 作为 测试 用 例 上 自动 运行 
>>> a=[1,2,3] 

>>> print [xX+3 forxmal 

[4. $5, 6] 


文档 注释 不 限于 中 英文 ， 但 不 要 中 英文 混用 。 
文档 注释 不 是 越 长 越 好 ， 通 第 一 两 句 话 能 把 情况 说 清楚 即 可 。 
模块 、 公 有 类 、 公 有 方法 ， 能 写 文档 注释 的 ， 应 该 尽量 写 文 档 注释 。 


代码 规范 


下 面 先 来 看 看 Python 的 代码 规范 ， 让 目 己 首先 有 个 意识 ， 然 后 在 往 后 的 开发 中 慢 慢 养 成 


习 民 。 


和 


编码 


各 无 特殊 情况 ， 文 件 一 律 使 用 UTF-8 编码 ， 文 件 头 部 必须 加 入 #*-coding:utf-8-*- 标 识 。 
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3. 


代码 格式 
统一 使 用 4 个 空格 进行 缩 进 。 

每 行 代码 尽量 不 超过 80 个 字符 ， 在 特殊 情况 下 可 以 略微 超过 80 个 字符 ， 但 最 长 不 得 
超过 120 个 字符 。 这 在 查看 side-by-side 的 di 全 时 很 有 帮助 ， 也 方便 在 控制 台中 查看 
代码 。 


5| 己 


简单 说 ， 目 然 语 言 使 用 双 引 号 ， 机 器 标识 使 用 单 引 号 。 因 此 ， 代 码 里 多 数 应 该 使 用 单 引 号 。 
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目 然 语言 使 用 双 引 号 "..."， 例 如 ， 错 误 信 息 ， 很 多 情况 下 还 是 Unicode， 使 用 uw" 你 好 
世界 "。 

机 器 标识 使 用 单 引 号 …"， 例 如 ，dict 里 的 key。 

正则 表达 式 使 用 原生 的 双 引 号 1"..."。 

文档 字符 串 使 用 三 个 双 引 号 ™"....."""。 


[re 上 一 


1 了 


异 块 级 函数 和 类 定义 之 间 空 两 行 ， 类 成 员 函 数 之 间 空 一 行 。 例 如 : 
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Class A: 


def 1mt (self): 
pass 


def hello(self): 
pass 

def mam’): 

pass 
可 以 使 用 多 个 空 行 分 隔 多 组 相关 的 函数 ， 或 使 用 空 行 分 隔 邮 辑 相 关 的 代码 。 
5. import 语句 
import 语句 主要 用 来 在 程序 中 导入 Python 标准 库 和 扩展 库 。 import 语句 应 该 分 行书 写 , 例如 : 
# 正确 的 写法 
1mport os 
1mport sys 
# 不 推荐 的 写法 
Import SVS.OS 


# 正确 的 写法 
from subprocess Import Popen, PIPE 


import 语句 最 好 使 用 绝对 引用 方式 ， 例 如 : 


# 正确 的 写法 
from foo.bar import Bar 


# 不 推荐 的 写法 
from ..bar mmport Bar 


import 语句 应 该 放 在 文件 头 部 ， 置 于 模块 说 明 及 docstring 之 后 ， 于 全 局 变量 之 前 ; 还 应 该 
按照 顺序 排列 ， 每 组 之 间 用 一 个 空 行 分 隔 。 例 如 : 


limport os 


1mport msepack 


Imbpofrt foo 
导入 其 他 模块 的 类 定义 时 ， 可 以 使 用 相对 导入 ， 例 如 : 
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from myclass 1mport MyClass 
如 果 发 生命 名 冲突 ， 则 可 使 用 名 称 空间 ， 例 如 : 


1mport bar 
1mport foo.bar 


bar.Bar() 
foo.bar.BarO 


6. 空格 


限 数 的 参数 列表 中 ，“,” 之 后 要 有 空格 。 

图 数 的 参数 列表 中 ， 默 认 值 等 号 两 边 不 要 添加 空格 。 
左 括号 之 后 ， 右 括号 之 前 不 要 加 多 有余 的 空格 。 

字典 对 象 的 左 括号 之 前 不 要 加 多 余 的 空格 。 

不 要 为 了 对 齐 赋值 语句 而 使 用 额外 的 空格 。 


7. 换行 


Python 支持 括号 内 换行 。 这 有 以 下 两 种 情况 。 
(1) 将 第 二 行 缩 进 到 括号 的 起 始 处 。 例 如 : 


foo = long function name(var one, var two, 
var three. var four) 


CO) 将 第 二 行 缩 进 4 个 空格 ， 适 用 于 从 起 始 括号 惑 换 行 的 情形 。 例 如 : 


def long function name( 
var one. var two, var three. 


var four): 
print(var one) 


使 用 反 和 斜 杠 \ 换 行 ， 二 元 运算 得 + 等 应 出 现在 行 末 ; 长 字符 串 也 可 以 用 此 法 换行 。 例 如 : 


session.query(MyTable).\ 
filter byQd=1)\ 


one() 
print Hello " 
‘Dos 90S1 9 


(Harry', Potter) 
另外， 禁止 使 用 复合 语句 ， 即 禁止 在 一 行 中 包含 多 个 语句 ，if/for/while 一 定 要 换行 。 
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在 二 元 运算 符 两 边 各 空 一 格 ， 二 元 运算 行 包括 =、-、 二 =、 一 、>、、is not、and 等 。 


第 2 章 Python 语言 基础 


标识 符 与 保留 字 


2.2.1 标识 稚 


A 
和 总 


标识 符 是 开发 人 员 在 程序 中 目 定 义 的 一 些 符号 和 名 称 ， 例 如 ， 目 己 定义 的 变量 名 、 函 数 名 
定义 标识 符 的 首要 原则 是 见 名 知 意 。 
标识 符 由 字母 、 下 男 线 和 数字 组 成 ， 且 不 能 以 数字 开头 。 注 意 ，Python 中 的 标识 符 区 分 大 


小 写 。 在 进行 标识 符 命 名 时 ， 一 般 齐 循 驼 峰 法 命名 规范 。 


多 )。 


e 小 驼峰 式 命 名 法 : 第 一 个 单词 以 小 写字 母 开始 : 第 二 个 单词 的 首 字 母 大 写 。 例 如 : 
myName、aDog 

e 大 驼峰 式 命 名 法 : 每 一 个 单词 的 首 字 母 都 采用 大 写字 母 。 例 如 ; 
FirstName、LastName 

程序 员 中 还 有 一 种 命名 法 比较 流行 ， 就 是 用 下 画 线 “_” 来 连接 所 有 的 单词 。 例 如 : 
send buf 

下 面 简单 介绍 Python 中 一 些 常用 对 象 的 命名 规范 。 

1. 模块 名 称 


模块 尽量 使 用 小 写 命名 ， 痛 字母 保持 小 写 ， 上 尽量 不 要 用 下 面 线 (除非 有 多 个 单词 且 数 量 不 
例如 : 


# 正确 的 模块 名 
import html parser 
# 不 推荐 的 模块 名 
1mport Decoder 
2. 类 名 
类 名 使 用 驼峰 命名 风格 ， 首 字母 大 写 ， 私 有 类 可 用 一 个 下 画 线 开 头 。 例 如 : 
class Farm'(): 
pass 
class AnimalFarm(Farm): 
pass 


class PrivateFarm(Farm): 
pass 


注意 : 
最 好 将 相关 的 类 和 顶级 函数 放 在 同一 个 模块 里 ， 不 像 Java， 没 必要 限制 一 个 类 一 个 模块 。 


3. 函数 名 
国 数 名 一 律 小 写 ， 如 有 多 个 单词 ， 用 下 画 线 隔 开 。 例 如 : 
def run(): 

pass 


def rn with envO): 


pass 
私有 函数 在 函数 名 前 加 一 个 下 夯 线 ， 例 如: 
class Person(): 


def private funcO): 


pass 
4. 变量 名 
变量 名 尽量 小 写 ， 如 有 多 个 单词 ， 用 下 男 线 隔 开 。 例 如 : 
i name 一 ”Imamn ' 

count=0 


school name=" 


Ol 


. 常量 名 
党 量 采 用 全 大 写 ， 如 有 多 个 单词 ， 用 下 男 线 隔 开 。 例 如 : 
MAA CLIENT= 100 
MAA CONNECTION = 1000 
CONNECTION ITIMEOUT = 600 
2.2.2 保留 字 
在 Python 交互 模式 下 ， 输 入 以 下 代码 ， 可 以 查看 Python 语言 的 保留 字 ， 即 关键 字 : 


1mport keyword 
keyword. kwlist 


Python 3.7 中 的 保留 字 如 图 2-1 所 示 。 


; 
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| 国 CWINDOWS\system3a\cmd.exe - python3 

inde A 
Type “help’”, “copyright”, “credits” or "license” for more information. 

[>>> import keyword 

|>>> keyword, kwlist 


fF False " None” , “Trip and ， ee assert “asyne ， “await ， reds Gla. ,CD 
ntinue 2 def ， del 2 e111 else " except’, ‘finally , "for ， from global ;， iE 
import ， in :Es lambda nonlocal , ”not or , Pass , Taise , Tettrn ， 


ttTy ， "while’ ; With, yield | 
pp 


图 21 Python37 中 的 保留 字 
任何 标识 符 不 得 与 保留 字 相 同 ， 以 免 造成 使 用 上 的 混淆 ， 


使 用 变量 


在 Python 中 ,变量 是 没有 类 型 的 ， 这 和 你 以 往 看 到 的 大 部 分 编辑 语言 都 不 一 样 。 在 使 用 变 
量 的 时 候 ， 不 需要 提前 声明 ， 只 需要 给 这 个 变量 赋值 即 可 。 如 果 只 写 一 个 变量 ， 而 没有 赋值 ， 
那么 Python 认为 这 个 变量 没有 定义 。 

在 Python 中 ， 当 创建 一 个 对 象 ， 然后 把 它 赋 给 另 一 个 变量 的 时 候 ，Python 并 没有 拷贝 这 个 
对 象 ， 而 只 是 拷贝 这 个 对 象 的 引用 。 


2.3.1 变量 定 


在 Python 中 ， 变 量 就 是 变量 ， 没 有 类 型 ， 大 家 所 说 的 “类 型 ”是 变量 所 指 同 内 存 中 对 象 
的 类 型 。 变 量 是 存储 在 内 存 中 的 值 。 创 建 变量 时 会 在 内 存 中 开辟 一 块 空间 。 声 明 一 个 变量 并 赋 
值 后 ， 基 于 变量 内 容 的 数据 类 型 ， 解 释 需 会 分 配 指定 内 存 ， 并 决定 什么 数据 可 以 存储 在 内 存 中 。 
因此 ， 变 量 可 以 指定 不 同 的 数据 类 型 ， 这 些 变量 可 以 存储 整数 、 小 数 或 字符 。 

等 写 (=) 用 来 给 变量 赋值 。 等 写 (=) 运 算 符 的 左边 是 变量 名 ， 等 写 (=) 运 算 符 的 右边 是 存储 在 
变量 中 的 值 。 例 如 : 


counter = 100 # 整 型 变量 

miles = 1000.0 # 浮 点 型 变量 

name = "runoob" # 字符 串 

Python 允许 开发 人 员 同 时 为 多 个 变量 赋值 。 例 如 : 
a=b=c=1 


这 条 语句 创建 了 一 个 整 型 对 象 , 值 为 1， 从 后 回 前 赋值 ，3 个 变量 被 赋予 相同 的 数值 。 也 可 
以 为 多 个 对 象 指定 多 个 变量 。 例 如 : 


abec=1.2 "rmoob" 


这 条 语句 将 两 个 整 型 对 象 1 和 2 分 配给 变量 a 和 b， 将 字符 串 对 象 "runoob" 分 配给 变量 c。 


2.3.2 ”变量 类 型 


Python 3 中 有 6 种 标准 的 数据 类 型 ，Number( 数 字 )、String( 字 符 串 )、List( 列 表 )、Tuple( 元 
组 )、Set( 集 合 )、Dictionary( 字 上 典 )。 其 中 , Number、String 和 Tuple 为 不 可 变 类 型 ; List、 Dictionary 
和 Set 为 可 变 类 型 。 下 面 将 详细 介绍 这 6 种 数据 类 型 。 


基本 数据 类 型 


本 节 主 要 介绍 6 种 标准 的 数据 类 型 。 
2.4.1 ”数字 类 型 


1. 数字 类 型 


数字 类 型 有 int、long、float 和 complex。 

(1) int( 整 型 ) 

在 32 位 机 器 上 , 整数 的 位 数 为 32 位 , 取 值 范围 为 -231~231 - 1, 即 -2 147 483 648 一 2 147 483 647。 
在 64 位 机 器 上 ， 整 数 的 位 数 为 64 位， 取 值 范围 为 -2 一 2 -1， 即 -9 223 372 036 854 775 808 一 
9 223 372 036 854 775 807。 

(2) long( 长 整 型 ) 

跟 C 语言 不 同 ，Python 的 长 整数 没有 指定 位 宽 ， 即 Python 没有 限制 长 整数 的 大 小 ， 但 实 
际 上 由 于 机 器 内 存 有 限 ， 长 整数 不 可 能 无 限 大 。 

自从 Python 2.2 起 ， 如 果 整 数 发 生 灌 出 ，Python 会 自动 将 整数 转换 为 长 整数 ， 所 以 ， 如 今 
即便 在 长 整数 的 后 面 不 加 字母 世 也 不 会 导致 严重 后 果 。 

(3) float( 浮 点 型 ) 

浮 点 数 用 来 处 理 实数 , 即 带 有 小 数 的 数字 。 类 似 于 C 语言 中 的 double 类 型 ， 占 8 个 字 节 (64 
位 )， 其 中 52 位 表示 底 ，11 位 表示 指数 ， 剩 下 的 一 位 表示 符号 。 

(4) complex( 复 数 ) 

复数 由 实数 部 分 和 虚数 部 分 组 成 ， 一 般 形式 为 x 十 yi， 其 中 ，x 是 复数 的 实数 部 分 ，y 是 复 
数 的 虚数 部 分 ， 这 里 的 x 和 y 都 是 实数 。 

2. 定义 数字 变量 和 查看 数据 类 型 

当 指定 一 个 值 时 ，Number 对 象 就 会 被 创建 ， 例 如 ; 

warl= 1 

var2= 10 

在 Python 3 中 ， 只 有 一 种 整数 类 型 mnt， 表示 为 长 整 型 ， 没 有 Python 2 中 的 long。 像 大 多 数 
语言 一 样 ， 数 值 类 型 的 赋值 和 计算 都 是 很 直观 的 。 

内 置 的 type0 函 数 可 以 用 来 查询 变量 所 指 对 象 的 类 型 。 例 如 : 

>>> gb., c, d= 20., $.5, True. 4+3] 
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>>> print(type(a). type(b). type(c), type(d)) 


<class Int> <class float > <class Dool> <class ‘complex~> 
此 外 ， 还 可 以 使 用 isinstanceO 函 数 来 判断 某 个 变量 是 否 属于 某 种 数据 类 型 ， 例 如 : 


二 
>>> 1sInstance(a, mt) 
True 


isinstance0 和 type0 函 数 的 区 别 在 于 : type0 函 数 不 会 认为 子 类 是 一 种 父 类 类 型 ，isinstance() 
函数 则 会 认为 子 类 是 一 种 父 类 类 型 。 示 例 程序 如 下 : 


>>> Class A: 

: pass 

>>> class B(A): #B 继承 于 A， 是 A 的 子 类 

2 pass 

>>> 1lSInstance(A(). A) 

True 

>>> type(A0)—A 

True 

>>> jisinstance(BO, A) 胡 sinstance0O 国 数 会 认为 子 类 是 一 种 父 类 类 型 
True 

rn f#type0 函 数 不 会 认为 子 类 是 一 种 父 类 类 型 
False 


注意 : 

在 Python 2 中 没有 布尔 型 ， 用 数字 0 表示 False， 用 1 表示 True。Pvython 3 把 Trme 和 False 
定义 成 关键 字 ， 但 它们 的 值 还 是 1 和 0， 它 们 可 以 和 数字 相 加 。 

3. 删除 变量 

当 不 需要 变量 之 后 ， 可 以 使 用 del 语句 删除 一 些 对 象 引 用 。del 语句 的 语法 格式 如 下 : 


del varl|[,.var2|[.var3|.....varN||| 

可 以 通过 使 用 del 语句 删除 单个 或 多 个 对 象 。 例 如 : 
del var # 删 除 单个 变量 

del var a,var b # 删 除 多 个 变量 

4. 数值 运算 


Python 可 以 同时 为 多 个 变量 赋值 ， 如 “a,b = 1 2”。 一 个 变量 可 以 通过 赋值 指向 不 同类 型 
的 对 象 。 数 值 的 除法 包含 两 个 运算 符 : 运算 符 / 返 回 一 个 浮 点 数 ， 运 算 符 /返回 一 个 整数 。 在 混 
合计 算 时 ，Python 会 把 整数 转换 成 浮 点 数 。 示 例 程序 如 下 : 


>>>5 十 4 ”#0 法 
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9 

>>>43 -2 # 减 法 

3 

>>> 3*7 # 琵 法 

21 

>>>2/4 # 除 法 ， 得 到 一 个 浮 点 数 
0.s 

>>> 2//4 # 除 法 ， 得 到 一 个 整数 
0 

>>>17%3  ”# 取 余 

2 

=>74+5 人 六 

32 


其 他 数值 类 型 示例 如 表 2-1 所 示 。 


表 2-1 其 他 数值 类 型 示例 


Int complex 

10 3 

100 45i 

-786 9322e - 36i 

080 323etl8 | 8g76i 

- 0490 - .6545+0i 

- 0x260 3e+26i 

0x69 4.53e -7i 


2.4.2 ”字符 串 类 型 


1. 定义 和 引用 字符 串 变量 

字符 串 或 串 (String) 是 由 数字 、 字 母 、 下 夯 线 组 成 的 一 串 字 符 ， 是 编程 语言 中 用 于 表示 文本 
的 数据 类 型 。 

Python 中 的 字符 串 用 单 引号 () 或 双 引 号 (") 插 起 来 ， 同 时 使 用 反 和 斜 杜 Q) 转 义 特 殊 字符 。 可 以 
创建 变量 来 保存 文本 。 例 如 : 


customer name ='Fred' 


该 语句 为 变量 指定 的 值 是 文本 字符 串 。customer name 保存 的 是 文本 而 非 数 字 。 可 在 任何 
用 到 字符 串 "Fred" 的 地 方 使 用 该 变量 。 例 如 : 

inessape = 'the name ls "+customer name 

在 上 面 指定 的 表达 式 中 ，customer name 变量 中 保存 的 文本 将 被 添加 a 到 字符 串 "the name is" 
的 末尾 。customer name 当前 保存 的 字符 串 是 "Fred"， 上 述 语 句 将 创建 男 一 个 字符 串 变 量 
message，message 中 包含 的 文本 内 容 为 "the name is Fred"。 
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2. 字符 串 堆 取 
字符 串 截 取 的 语法 格式 如 下 : 


变量 [ 头 下 标 : 尾 下 标 ] 


如 果 方 向 为 从 左 到 右 ， 第 一 个 索引 值 为 0， 如 果 方 向 为 从 右 到 左 ， 右 边 最 后 一 个 字符 的 索 
引 值 为 - 1。 字 符 串 截取 示意 图 如 图 2-2 所 示 。 


从 后 面 索引 : -6 -5 -4 -3 -2 -1 


-一 一 十- =- 十 --- 十 --- 十 - ~- -十 -- -十 
CT 


+---+---+---+---+---+--- 二 


从 前 面 截取 : 5 
从 后 面 截 取 : 3 


2-2 ”字符 串 截 取 示 意图 
加 号 + 是 字符 串 的 连接 符 ， 星 号 * 表 示 复 制 当 前 字符 串 ， 紧 跟 的 数字 为 复制 次 数 。 示 例如 下 : 
#1/usr/bimypython3 


str =" helloworld ' 


print(st) # 输出 字符 串 
print(st[0:-1 ”。 # 输出 第 一 个 到 倒数 第 二 个 的 所 有 字符 
print(str[0]) # 输出 字符 串 的 第 一 个 字符 


print(str[2:5]) 。 。”# 输出 从 第 三 个 开始 到 第 五 个 的 所 有 字符 
print(str[2:]) # 输出 从 第 三 个 开始 的 所 有 字符 

print(str * 2) # 输出 字符 串 两 次 

printstr+ "TEST") # 连接 字符 串 


执行 以 上 程序 会 输出 如 下 结果 : 


helloworld 
helloworl 

h 

llo 

lloworld 
helloworldhelloworld 
helloworldITEST 


Python 使 用 反 斜 杠 Q) 转 义 特 殊 字符 ， 如 果 不 想 让 反 斜 杠 发 生 转 义 ， 可 以 在 字符 串 的 前 面 添 
加 一 个 r， 表 示 原 始 字 符 串 ， 例 如 : 


>>> print(c:\windows'system32\nova') 
cwindows'system32 


OVa 
>>> print(r'c:\windows\'system32\nova') 
cwindows\system32\nova 


另外 ， 反 和 斜 杠 人 可 以 作为 续 行 符 ， 表 示 下 一 行 是 上 一 行 的 延续 。 也 可 以 使 用 """…""" 或 所" 
跨越 多 行 。 需 要 注意 的 是 ，Python 没有 单独 的 字符 类 型 ， 一 个 字符 就 是 长 度 为 1 的 字符 串 。 
例如 : 


>>>Word = 了 Python 

>>> print(word[0], word[5]) 
pn 

>>> print(word[-1], word[-6]) 
nP 


与 C 字符 串 不 同 的 是 ，Python 字符 串 不 能 改变 。 辣 一 个 索引 位 置 赋值 (比如 word[0] = '"m") 
会 导致 错误 。 

注意 : 

(1) 反 斜 杠 可 以 用 来 转 义 ， 使 用 [可 以 让 反 斜 杠 不 发 生 转 义 。 

(2) 字符 串 可 以 用 + 运算 符 连 接 在 一 起 ， 用 * 运 算 符 重 复 

(3) Python 中 的 字符 串 有 两 种 索引 方式 ， 从 左 往 右 以 0 开始 ， 从 右 往 左 以 -1 开始 。 

(4) Python 中 的 字符 串 不 能 改变 ， 


2.4.3 布尔 类 型 

Python 文 持 布尔 类 型 的 数据 ， 布 尔 类 型 只 有 True 和 False 两 个 值 ， 但 是 布尔 类 型 支持 以 下 
几 种 运算 。 

e 与 运算 : 只 有 两 个 布尔 值 都 为 True 时 ， 计 算 结果 才 为 True。 例 如: 

True and Tme #—> Tme 

True andFalse #—> False 

False and True  #—> False 

False and False #—> False 

e 或 运算 : 只 要 有 一 个 布尔 值 为 Tme， 计 算 结 果 就 是 True。 例 如 : 


TrmeorTme #O°—> Tme 
Trme orFalse #0°—> Trmue 
Falseor Ime 并 一 > Tme 
False or False #0—> False 


e 非 运算 : 把 True 变 为 False， 或 者 把 False 变 为 True。 例如: 


not TIme “并 一 False 
not False  #—> True 


布尔 运算 在 计算 机 中 用 来 做 条 件 判断 ， 根 据 计算 结果 为 True 或 False， 计 算 机 可 以 自动 执 
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行 不 同 的 后 续 代 码 。 

在 Python 中 ， 布 尔 类 型 还 可 以 与 其 他 数据 类 型 做 and、or 和 not 运算 ， 请 看 下 面 的 代码 : 

a= True 

print a and ‘a=T" or 'a=F" 

计算 结果 不 是 布尔 类 型 ， 而 是 字符 串 'a=T， 这 是 为 什么 呢 ? 因为 Python 把 0、 空 字符 串 " 
和 None 看 成 False， 将 其 他 数值 和 非 空 字符 串 都 看 成 Trmme， 所 以 ，True and 'a=T' 的 计算 结果 是 
"a 一 T'。 继 续 计 算 'a=T' or 'a=F'"， 计 算 结 果 还 是 'a=T'。 

要 解释 上 述 结果 ， 又 涉及 and 和 or 运算 的 一 条 重要 法 则 : 短路 计算 。 

在 计算 aandb 时 ， 如 果 a 是 False， 则 根据 与 运算 法 则 ， 整 个 结果 必定 为 False， 因 此 返回 
a; 如 果 a 是 Trme， 则 整个 计算 结果 必定 取决 于 b， 因 此 返回 b。 

在 计算 aorb 时 ， 如 果 a 是 Tme， 则 根据 或 运算 法 则 ， 整 个 计算 结果 必定 为 Tme， 因 此 返 
a; 如 果 a 是 False， 则 整个 计算 结果 必定 取决 于 b， 因 此 返回 bb。 

所 以 ，Python 解释 占 在 做 布尔 运算 时 ， 只 要 能 提前 确定 计算 结果 ， 它 残 不 会 往 后 计算 了 ， 
直接 返回 结果 。 


2.4.4 数据 类 型 转换 


对 Python 内 置 的 数据 类 型 进行 转换 时 ， 可 以 使 用 内 置 函数 ,常用 的 数据 类 型 转换 函数 如 表 
2-2 所 示 。 


表 2-2 数据 类 型 转换 函数 


函数 格式 使 用 示例 描述 


Tasap 可 以 转换 的 包括 String 类 型 和 其 他 数字 类 型 ， 但 是 会 丢失 
精度 


float(x) float(1) 或 float("1") 可 以 转换 String 和 其 他 数字 类 型 ， 不 足 的 位 数 用 0 补 齐 ， 
例如 1 会 变 成 1.0 
complex(real imag) complex("1") 或 第 一 个 参数 可 以 是 String 或 数字 类 型 ， 第 二 个 参数 只 能 为 
complex(1.2) 数字 类 型 ， 第 二 个 参数 没有 时 默认 为 0 


so 将 数字 转换 为 Sting 类 型 
reprG 返回 一 个 对 象 的 Sting 格式 


eval(str) eval("12+23") 执行 一 个 字符 串 表达 式 ， 返 回 计 算 的 结果 ， 如 例子 中 返回 
35 
tuple(seq) tuple((1.2.,3.4)) 参数 可 以 是 元 组 、 列 表 或 字典 ， 为 字典 时 ， 返 回 由 字典 的 
key 组 成 的 集合 
list(s) list((1.2.3.4)) 将 序列 转变 成 列表 ， 参 数 可 为 元 组 、 字 典 、 列 表 ， 为 字典 
时 ， 返 回 由 字典 的 key 组 成 的 集合 
set(s) Set [ty ,wi, '0', nT) 将 一 个 可 进 代 对 象 转变 为 可 变 集 合 ， 并 且 去 重复 ， 返 回 结 
或 set("asdfg") 果 可 以 用 来 计算 差 集 x-y、 并 和 集 x|y、 交 和 集 x&y 
frozenset(s) frozenset([0, 1, 2, 3. 4, | 将 一 个 可 进 代 对 象 转变 成 不 可 变 集合 ， 参 数 为 元 组 、 字 典 、 
5. 6.7.8.9]) 列表 等 


( 续 表 ) 
描述 
chr(Ox30) chr0O 函 数 使 用 一 个 范围 在 range(256) 内 (就 是 0 一 2$5) 的 整 
数 作 为 参数 ， 返 回 一 个 对 应 的 字符 。 返 回 值 是 当前 整数 对 
应 的 ASCI 字符 
ord(x) oda) 返回 对 应 的 ASCII 数值 或 Unicode 数值 
Re 把 一 个 整数 转换 为 十 六 进 制 字符 串 


a 把 一 个 整数 转换 为 八进制 字符 串 


本 节 主 要 介绍 Python 的 运算 符 。 举 个 简单 的 例子 : 4+5=9。 在 这 个 例子 中 ，4 和 5 被 称 为 
操作 数 , + 被 称 为 运算 符 。Python 语言 支持 以 下 类 型 的 运算 符 : 算术 运算 符 、 比 较 (关系 ) 运 算 符 、 
赋值 运算 符 、 逻辑 运算 符 、 位 运算 符 、 成 员 运 算 符 、 身份 运算 符 。 下 面 逐 个 进行 介绍 。 


2.5.1 算术 运算 稚 
算术 运算 符 主 要 用 于 两 个 对 象 的 算术 计算 (加 减 乘除 等 运算 )， 如 表 2-3 所 示 。 
表 2-3 算术 运算 符 


假设 变量 :a=10，b=20，a +b 输出 结果 30。 
>>>24= 10 

>>>b=15 

>>> a+b 

+ 两 个 对 象 相 加 25 

>>> 4= ni 

>>>b = hao 

>>> q+b 

‘nhao' 


假设 变量 : a=10，b=20，a -b 输出 结果 - 10。 
>>>4= 10 

>>>b=3 

>>>4-b 

1 


得 到 负数 或 使 用 一 个 
数 减 去 另 一 个 数 


假设 变量 :a=10，b=20，a *b 输出 结果 200。 
两 个 数 相 乘 或 返回 一 | >>>a=2 

小 被 重复 耕 干 次 的 字 | >>>b=10 
符 串 >>>a*b 

20 


算术 运算 符 


/ xX 除 以 y 


3.0 


返回 除法 的 余数 


Vo 


0 


冰冰 


返回 的 y 次 入 


1024 


1 返回 商 的 整数 部 分 


9 


2.5.2 ”比较 运算 符 


假设 变量 : 
>>>4=2 
>>b=10 
>>>b/a 


假设 变量 : 


>>>4=2 


假设 变量 : 
果 100000000000000000000。 
> 二 2 


> > bh = 


假设 变量 : 
出 结果 4.0。 
一 2 
>>>b=10 


>>>b//a 
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( 续 表 ) 


示例 


a=10，b=20，b/a 输出 结果 2。 


a=10，b=20，b%a 输出 结果 0。 


>>>b=10 


>>>b%a 


a=10，b=20，a**b 表示 10 的 20 次 方 ， 输 出 结 


10 


>>> 9 ** 呈 


a 二 10，b=20，9//2 的 输出 结果 为 4，9.0//2.0 输 


比较 (关系 ) 运 算 符 用 于 比较 两 个 对 象 (判断 是 否 相 等 、 大 于 )， 如 表 2-4 所 示 。 


表 2-4 


和 


比较 对 象 是 否 相等 


比较 运算 符 


示例 
假设 变量 : 


一 2 
b=10 
>>> 4b 
False 


10，b=20，(a 一 了 返回 False。 
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比较 两 个 对 象 是 否 不 相等 


比较 两 个 对 象 是 否 不 相等 


返回 x 是 否 大 于 y 


返回 xX 是 否 小 于 y。 所 有 比较 运算 符 返 
回 1 表示 真 , 返回 0 表示 假 。 这 分 别 与 
特殊 的 变量 True 和 False 等 价 


返回 X 是 否 大 于 或 等 于 y 


返回 x 是否 小 于 或 等 于 y 


2.5.3 ”赋值 运算 符 


赋值 运算 符 用 于 为 对 象 赋值 ， 将 运算 符 右 边 的 值 (或 计算 结果 ) 赋 给 运算 符 左 边 的 变量 
值 运算 符 如 表 2-5 所 示 。 
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假设 变量 : 
>>>a4=2 
>>>b=10 


>>>a(=b 


2—10, 


True 


( 续 表 ) 


示例 


b=20，(a !=b) 迟 回 True。 


Python 3.6 中 没有 这 个 运算 符 


假设 变量 ;: 
> a=2 


>>>b=10 


10, 


>>> bb 


False 


假设 变量 : 
on 


>>>b=10 


3 一 ]0， 


>>>a<hb 


True 


假设 变量 : 
>>>a= 10 
>>>b=10 


Dr 


3 一 10U， 


True 


假设 变量 : 
>>>4=10 


>>>b=10 


a—10, 


>>> 4b 


True 


b=20，(a >b) 返 回 False。 


b=20，(a <b) 返 回 True。 


b=20，(a >>=b) 返 回 False。 


b=20，(a <= 了 bb) 返 回 Trme。 


， 冉 


简单 的 赋值 运算 符 


加 法 赋值 运算 符 


减法 赋值 运算 符 


乘法 赋值 运算 符 


除法 赋值 运算 符 


第 2 章 Python 语言 基础 


表 2-5 ”赋值 运算 符 
实例 


假设 变量 : a=10, b=20, c =a+b 表示 将 a+b 的 运算 结果 赋值 给 c。 
>>>a= 10 

>>>9 

10 

>>>a=10+5 

>>>a 

15 


假设 变量 :a=10，b=20，c +=a 等 效 于 c=c++a。 
>>>4=0 
>>>4+—1 
>>>aq 

] 
>>>a=10 
> 8 

]1 

>>> 8 二 时 
>>> q+='b 
>>>4q 

ab' 


假设 变量 ，a=10，b=20，c - =a 等 效 于 c=c-a。 
>>> = 10 

>>>9 -= 

>>>a 

9 


假设 变量 ; a=10，b=20，c *=a 等 效 于 c=c*a。 
>>> 4=2 

>>> a*=10 

>>> 有 a 

20 

>>>a='7 

>>>q*=5 

>>> 有 a 


TZ7ZZ7 


假设 变量 ，a=10，b=20，c 三 a 等 效 于 c=c/a。 


>>>a4= 10 
>>>4 上 /2 
>>>a 

3.0 
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玫 中 一 


取 模 赋值 运算 符 


蜂 赋 值 运 算 符 


2.5.4 ”逻辑 运算 符 


远 辑 运算 符 


and 


OT 


not 


如果 多 为 False，xXxandy 返回 False， 否 则 返 


回 y 的 计算 值 


如 果 X 非 0， 就 返回 x 的 值 ， 否 则 返回 y 的 


计算 值 


加 果 X 为 Trme, 返回 False; 如 果 X 为 False， 
返回 Tme 


Cc 00a 等 效 于 c=c%a。 


~>>a= 10 
>>>a%=3 
>>> 8 

| 


C +# 一 3 等 效 于 C=Ct+ta。 


>>> A 二 2 


>>>a**— 10 


>>>a 
1024 


Cc//=a 等 效 于 c=c//a。 


>>>8 一 ]] 
>>> /2 
>>>a 

5 


表 2-6 远 辑 运算 符 


逻辑 运算 符 用 于 逻辑 运算 (与 、 或 、 非 等 )， 逻 辑 运 算 符 如 表 2-6 所 示 。 


2 二 
>>>b=1 
>>> a andb 
0 

>>> d='g 
>>> a andb 
] 


2 一 在 
>>>b=1 
>>>aorb 
] 


>>>4=0 
>>> not a 


True 


示例 


( 续 表 ) 


2.5.5 ”位 运算 符 


位 运算 符 


< 二 


全 人 > 
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位 运算 符 用 于 对 Python 对 象 进 行 位 操作 。 位 运算 符 如 表 2-7 所 示 。 


表 2-7 位 运算 符 


对 于 参与 运算 的 两 个 值 ， 如 果 两 个 相应 位 都 
为 1， 则 该 位 的 结果 为 1， 否则 为 0 


只 要 对 应 的 两 个 二 进 制 位 中 有 一 个 为 1， 结 
果 位 就 为 ] 


当 对 应 的 两 个 二 进 制 位 相 异 时 ， 结 条 为 1 


对 数据 的 每 个 二 进 制 位 取 反 ， 也 就 是 把 1 变 
为 0， 把 0 变 为 1 


将 运算 数 的 各 二 进 制 位 全 部 左 移 奉 干 位 ， 由 
<< 右 边 的 运算 数 指定 要 移动 的 位 数 ， 高 位 丢 
弃 ， 低 位 补 0 


把 >> 左 边 的 运算 数 的 各 二 进 制 位 全 部 右 移 夺 
干 位 ， 由 >> 右 边 的 运算 数 指定 要 移动 的 位 数 


示例 

(a&b) 输 出 结果 12， 二 进 制 解释 : 0000 1100 
>>> 3] 
>>> b=2 
>>> ab 
0 
>>> b=3 
>>> ab 

] 
(a|b) 输 出 结果 61 ， 二 进 制 解释 : 0011 1101 
> 一 
>>>b=2 
>>> alb 

3 
(a 人 ^b) 输 出 结果 49， 二 进 制 解释 : 0011 0001 
2 一 
>>>b=3 
>>> ab 
2 
(~a) 输 出 结果 - 61， 二 进 制 解释 : 1100 0011， 
是 一 个 有 符号 二 进 制 数 的 补 码 形式 。 
2 一 有 
>>> -~ 

< 
>a=1 
>>> ~a 

= 
a=2,a<<2 输 出 结果 8, 二进制 解释 : 0000 0010， 
同 右 移 两 位 ， 变 为 0000 0100。 
pr 
>>> <<2 
8 
a >>2 输出 结果 15， 二 进 制 解 释 ，0000 1111 
>>>a=16 
>>>a>>]1 
8 


2.5.6 ”成员 运算 和 


成 员 运 算得 用 于 判断 一 个 对 象 是 否 包含 男 一 个 对 象 ， 成 员 运 算 符 如 表 2-8 所 示 。 


表 2-8 成 员 运 算 符 


成 员 运 算 符 


如 果 在 指定 的 序列 中 找到 值 ， 返回 
二 Trme， 否 则 返回 False 

如 果 在 指定 的 序列 中 没有 找到 值 ， 
not m 


返回 True， 否则 返回 False 


2.5.7 ”有 身份 运算 符 


示例 
假定 X 在 yY 序 列 中 。 如 果 X 在 y 序 列 中 ， 返 回 Tiue。 
> 有 一 时 
>>> b= cba' 
>>>amb 
True 
>>> b= list(b) 
>>>b 
[ce','b' "a 
>>>3amb 
True 
假定 x 不 在 y 序 列 中 。 如 果 X 不 在 y 序 列 中 , 返回 True。 
>>> 和 一 时 
>>> b='cha 
>>> anot mb 
False 
>>> b= lst(b) 
>>>b 
[cb 'al 
>>> anot mb 
False 


号 份 运算 符 用 于 判断 是 否 引用 目 茶 个 对 象 ， 身 份 运算 符 如 表 2-9 所 示 。 


表 2-9 身份 运算 符 


成 员 运算 符 


判断 两 个 标识 符 是 不 是 引用 


示例 


xisy， 类 似 于 id(x) 一 id()。 如 果 引 用 的 是 同一 个 对 象 ， 返 


x is not y， 类 似 于 id(a) (= id(b)。 如 果 引 用 的 不 是 同一 个 对 


目 某 个 对 象 True， 否 则 返回 False 
a 判断 两 个 标识 符 是 不 是 引用 
Ce 自 不 同 对 象 象 ， 返 回 结果 True， 和 否则 返回 False 
is 和 = 一 的 区 别 是 : is 用 于 判断 两 个 变量 引用 的 对 象 是 否 为 同一 个 ， 
的 值 是 否 相 等 。 


一 用 于 判断 引用 变量 
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注意 : 


id0 函 数 用 于 获取 对 象 的 内 存 地 址 。 


2.5.8 ”运算 和 从 的 优先 级 


在 一 个 表达 式 中 , 可 能 包含 多 个 由 不 同 运 算 和 从 连接 起 来 的 、 具 有 不 同 数 据 类 型 的 数据 对 象 ; 
由 于 表达 式 有 多 种 运算 ， 不 同 的 运算 顺序 可 能 得 出 不 同 结果 甚至 出 现 运算 错误 ， 因 为 当 表达 式 
中 含 多 种 运算 时 ， 必 须 按 一 定 顺序 进行 结合 ， 才 能 保证 运算 的 合理 性 和 结果 的 正确 性 、 唯 一 性 。 
优先 级 从 上 到 下 依次 递减 , 最 上 面 的 运算 符 具有 最 高 的 优先 级 , 喜与 运算 符 具 有 最 低 的 优先 级 。 
表达 式 的 结合 次 序 取 决 于 表达 式 中 各 种 运算 符 的 优先 级 。 优 先 级 高 的 运算 符 先 结合 ， 优 先 级 低 
的 运算 符 后 结合 ， 同 一 行 中 的 运算 符 的 优先 级 相同 ， 如 表 2-10 所 示 。 


表 2-10 ”运算 符 的 优先 级 (从 高 到 低 ) 


运算 符 摘 述 
和 指数 (最 高 优先 级 ) 
本 按 位 翻转 ， 一 元 加 号 和 减 号 
* /% 1 乘 、 除 、 取 模 和 取 整 除 
下 加 法 、 减 法 
>> << 右 移 、 左 移 运 算 符 
& 按 位 与 
位 运算 和 从 
二 <> >— 比较 运算 符 
= 等 于 或 不 等 于 运算 符 
= %W= / /= -= = 一:#+ 一 赋值 运算 符 
is is not 身份 运算 符 
in not in 成 员 运算 符 
not or and 逻辑 运算 符 


运算 符 优 先 级 的 简单 示例 如 下 : 


# codine—utf-8 

# 优 先 级 的 简单 实例 
prontyNumber=2+1*4 

print priorityNumber # 输 出 结果 : 6 
# 昭 运算 ** 

pronityNumber—2*2**3 

print priorityNumber # 输 出 结果 : 16 


# 正 负 号 
print 1+2* - 3 草 痊 出 结果 :，- $ 


#* /~、% 


print 2+1*2/$5”# 答 出 结果 : 2 


##+、 > 

print 3<<2+1 # 输 出 结果 : 24 
# 比 较 运算 符 
priority=2*3+2<=—2+1*7 

print priority # 输 出 结果 ; Tme 


# 在 没有 更 高 优先 级 运算 符 ， 即 只 有 同 级 运算 符 时 从 左 到 右 结 合 
print 1+2+3*5+5”# 输 出 结果 : 23 


# 在 有 赋值 运算 符 时 ， 从 右 到 左 结 合 ， 即 先 算出 1+2 的 值 ， 再 赋值 给 priority 
priority=1+2 
print priority # 输 出 结果 : 23 


基本 输入 输出 


在 前 耐 章 市 中 ， 你 其 实 已 经 接触 了 Python 的 输入 输出 功能 。 本 节 将 具体 介绍 Python 的 输 
入 输出 。 


2.6.1 ”使 用 input() 函 数 输 入 
inputO 函 数 用 于 获得 用 户 输入 的 数据 ， 语 法 格式 如 下 : 
量 =input( 提 示 字 符 串 ') 


变量 和 提示 字符 串 都 可 以 省 略 ， 用 户 的 输入 以 字符 串 形 式 返回 给 变量 。 按 Enter 键 完成 输 
按 Enter 键 之 前 的 所 有 内 容 将 作为 输入 字符 串 赋 给 变量 。 例 如 : 


>>>a=input( 请 输入 数据 : ， 
请 输入 字符 串 : 'abc' 123,456 "Python" 
>>>4 

abc' 123.456 "Python" 
a=input( 请 输入 数据 : ) 

请 输入 字符 串 : 'abc' 123.456 "Python" 
>>>a 

abc' 123.456 "Python" 


如 果 输 入 的 数据 为 int 或 float 类 型 ， 则 需要 先 输入 字符 串 ， 然 后 使 用 int(a) 的 形式 。 例 如 ， 
输入 a 后 执行 a+l 操作 : 


>>>int(a)+l 
>>>Int(a)+l 


否则 会 出 现 TypeEror 异常 。 如 果 使 用 input0 函 数 输入 数据 ， 但 实际 没有 输入 任何 数据 ， 


区 
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那么 使 用 CtrltZ 组 合 键 输 入 时 ， 会 产生 EOFError 异常 。 
2.6.2 ”使 用 printO) 函 数 输出 
Python 中 的 基本 输出 操作 使 用 print0 函 数 实现 ， 语 法 格式 如 下 : 
print([obj1....J[.sep=" "][.end=\n"]Lfile=sys.stdout]) 
参数 列表 中 ， 各 项 参数 含义 如 下 : 
e [表示 可 以 省 略 的 参数 ， 上 述 全 部 参数 都 可 以 省 略 ， 同 时 后 三 个 参数 省 略 的 话 表示 使 用 
默认 值 (用 等 号 指定 的 默认 值 )。 
e ”sep 表示 分 隔 符 ， 即 第 一 个 参数 中 对 象 之 间 的 分 隔 符 ， 默 认为 空格 符 (" )。 
e end 表示 结尾 符 ， 即 句 末 的 结尾 符 ， 默 认为 \n'。 


e file 表示 输出 位 置 ， 即 输出 到 文件 还 是 命令 行 ， 默 认为 sys.stdout， 表 示 命 令 行 (终端 )。 
示例 代码 如 下 : 


>>>print0 天 得 出 衬 行 ， 即 使 用 默认 的 结尾 竺 ， 默 认为 m， 默 认 的 输出 文件 为 标准 输出 文件 


>>>print(123) # 输 出 123 

123 

>>>print(123.abc.45.book) ”# 使 用 默认 的 分 隔 符 sep="'"， 输 出 : 123 abc 45 book 
123 abc 45 book 

>>>print(123.'abe', 45, book', sep- 迪 .end-= -print(lalalala) 。 痢 痊 出 ，123#fabcff4sfboolkelalalala 
123#abc#4$#book—lalalala 

>>>filel=open(‘data.txt,'w') 桂 ] 开 文件 

>>>print(123.abc'.4S.book ,file=filel) ”# 用 file 参数 指定 输出 到 文件 
>>>filel.closeO # 关 闭 文 件 

>>>print(open('data.txt .read)) # 输 出 从 文件 中 读 取 的 内 容 

123 abc 45 book 


本 章 实战 


本 节 主 要 使 用 前 面 介绍 的 变量 、 数 据 类 型 、 运 算 符 、 输 入 输出 知识 ， 创 建 几 个 小 程序 ， 让 
大 家 巩固 所 学 。 


2.7.1 求 和 


本 例 将 接收 用 户 输 入 的 两 个 数字 ， 然 后 对 这 两 个 数字 求 和 ， 将 求 和 结果 显示 出 来 。 程 序 代 
但 如 下 : 


# -*- codine: UTF-8 -*- 

# Filename :ch02 sum.py 

# 用 户 输入 数字 

numl = input( 输 入 第 一 个 数字 ; 1) 
num2 二 input( 输 入 第 二 个 数字 : ") 


# 求 和 

sum = float(numl]) + float(num2) 

# 显示 计算 结果 

print( 数 字 {0} 和 {1} 相 加 结果 为 : {2}'format(mml, num2, sum)) 


执行 以 上 代码 输出 结果 为 : 

RESTART: C:/projects/ch02sum py 
输入 第 一 个 数字 :; 5$ 
数字 5 和 6 相 加 结果 为 : 11.0 


在 该 例 中 ,通过 和 输入 两 个 数字 来 求 和 。 这 里 使 用 内 置 函 数 input0 来 获取 用 户 的 输入 ,inputO 
返回 一 个 字符 串 ， 所 以 需要 使 用 float0 方 法 将 这 个 字符 串 转换 为 数字 。 

在 对 这 两 个 数字 求 和 时 使 用 了 加 号 (人 运算 符 ， 此 外 ， 还 有 减 号 ( - )、 乘 号 (*)、 除 号 ()、 地 
板 除 (/) 或 取 余 (0%) 运 算 御 。 这 些 数字 运算 都 可 以 这 样 进行 实践 。 

还 可 以 将 以 上 运算 合并 为 一 行 代 人 码 : 

# -*- codine: UTF-8 -*- 

# Filename : chO2sum .py 

print( 两 数 之 和 为 %.1f %(float(input( 输 入 第 一 个 数字 : )Hloat(input( 输 入 第 二 个 数字 : ")))) 

执行 以 上 代码 ， 输 出 结果 如 下 : 


输入 第 一 个 数字 : 1.5 
输入 第 二 个 数字 : 2.5 
两 数 之 和 为 4.0 


2.7.2 求 平 万 根 


平方 根 义 叫 二 次 方 根 ， 表 示 为 六 ， 比 如 Vi6 =4， 可 用 语言 描述 为 : 根 号 下 16=4。 
在 以 下 示例 中 ， 输 入 一 个 数字 并 计算 这 个 数字 的 平方 根 。 

# -*- Codmg: UTF-8 -*- 

# Filename : ch02sqrt py 

num = float(input( 请 输入 一 个 数字 :”)) 

num sqrt=num** 0.5 

print( %0.3f 的 平方 根 为 %0.3f%(num .num sqrb) 


执行 以 上 代码 ， 输 出 结果 如 下 : 
和 RESTART: C:/projects/chO2sqrt.py 

请 和 输入 一 个 数字 : 16.0 

16.000 的 平方 根 为 4.000 

在 该 例 中 ， 输 入 一 个 数字 ， 并 使 用 指数 运算 得 ** 计 算 该 数 的 平方 根 。 
该 程序 只 适用 于 正 数 。 负 数 和 复数 可 以 使 用 以 下 方式 计算 : 
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# -*- codine: UTF-8 -*- 

# Filename : ch02sqrt py 

# 计算 实数 和 复数 的 平方 根 
# 导入 复数 数学 模块 


Import cmath 
num = intGnput(" 请 输入 一 个 数字 ;。")) 


num sqrt= cmath.sqrt(num) 
print({0} 的 平方 根 为 {1:0.3fi+{2:0.3fi .formatmum .num sqrt.real.num sqrt.imae)) 


执行 以 上 代码 ， 输 出 结果 如 下 : 
一 一 RESTARTC:prolectsch02sqrtl.PY 
请 输入 一 个 数字 : -25 

- 25 的 平方 根 为 0.000+5.000i 

该 例 中 使 用 了 cmath(complex math) 模 块 的 sqrt0 方 法 。 
2.7.3 ” 求 水 仙 花 数 


数学 中 的 水 仙 花 数 是 这 样 定义 的 :“ 水 仙 花 数 ” 是 指 一 个 三 位 数 , 它 的 各 位 数字 的 立方 和 等 
于 它 本 身 ， 比 如 370、371。 现 在 要 求 输出 m~n 范围 内 的 所 有 水 仙 花 数 。 

运行 程序 时 ， 要 求 输出 给 定 范围 内 的 所 有 水 仙 花 数 ， 也 就 是 说 ， 输 出 的 水 仙 花 数 必 须 大 于 
或 等 于 mm， 并且 小 于 或 等 于 n。 如 果 有 多 个 ， 则 要 求 从 小 到 大 排列 后 在 一 行内 输出 ， 之 间 用 一 
个 空格 隔 开 ;， 如 果 给 定 的 范围 内 不 存在 水 仙 花 数 ， 则 输出 no0; 每 个 测试 的 输出 占 一 行 。 

例如 ， 输 入 : 


300 380 
输出 如 下 水 仙 花 数 : 
370 371 


现在 分 析 一 下 本 例 。 从 控制 台 一 次 性 获取 以 空格 分 开 的 数据 ， 应 该 想到 的 是 inputO.splitO。 
但 是 这 样 获 得 的 数据 类 型 是 列表 (list), 且 列 表 中 的 每 个 元 素 都 是 字符 串 (str), 现在 需要 进一步 将 
列表 中 的 元 素 转 换 成 数值 类 型 Gnt)。 这 里 采用 一 种 简便 的 方法 一 一 使 用 map0 函 数 。map0 是 
Python 内 置 的 高 阶 函 数 ， 它 接收 一 个 函数 们 以 及 一 个 列表 list， 通 过 将 妈 依 次 作用 在 list 的 每 
个 元 素 之 上 ， 返 回 一 个 map。 之 后 ， 使 用 list0 将 map 转换 成 一 个 列表 ， 这 个 列表 的 前 两 个 元 素 
就 是 所 需要 遍历 的 区 间 。 因 此 ， 接 收 输 入 数据 的 语句 应 该 是 : 
list(map(int, inputO.splitO)) 
因为 水 仙 花 数 存在 的 区 间 只 可 能 是 三 位 数 ， 即 100 一 999， 所 以 当 输入 不 满足 三 位 数 的 数字 
变 成 离 输 入 数字 最 符合 的 三 位 数 即 可 。 
最 后 讨论 一 下 输出 数据 。 输 出 数据 要 从 小 到 大 排列 ， 且 在 一 行内 用 空格 分 开 。 在 每 次 循环 
遍历 的 过 程 中 ， 如 果 找 到 水 仙 花 数 ， 就 把 它 保存 到 一 个 列表 中 ， 在 结束 的 时 候 输出 列表 中 的 每 


时 


45 量 


一 个 元 素 。 这 显然 使 用 循环 搭配 print0 函 数 是 做 不 到 的 。 在 这 里 使 用 join0 函 数 打 印 结 果 。 joinO 
用 于 将 序列 中 的 元 素 以 指定 的 字符 连接 生成 一 个 新 的 字符 串 。 语 法 如 下 : 

string.joinO 

join 后 面 的 括号 中 是 字符 序列 ，string 表示 每 个 字符 序列 中 的 间隔 字符 。 

在 测试 该 例 时 需要 注意 : 

(1) 输入 的 不 是 一 个 三 位 数 。 

(2) 输入 多 个 数 。 

G) 输入 的 第 二 个 数 小 于 第 一 个 数 。 


input list =ist(map(int, inputO .splitO)) 


if input list[0] < 100: 
input list[0] = 100 


if input list[0] > 999: 
input list[0] = 999 


if input list[1] < 100: 
input list[1] = 100 


if input list[1] > 999: 
input list[1] = 999 


1 mput lstl0|> Input list[1|: 
temp = mput list[0] 
Input lst[0|] = mput list[1] 
input list[1|= temp 


result=|] 


for1mranse(mput list[0], mput list[]| + 1): 
bal=1/ 100 
sh=(1-bal* 100) /10 
2e=1% 10 


i 一 {bal ** 3)+ (shi** 3)+(pe ** 3): 
result.append(1) 


if len(result) 一 0: 
print(no') 
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else: 
print( .Jom(strelementb tor element In result)) 


ji 去 和 了 程序 输 出 结 果 如 下 : 


RESTART: C:/projects/ch02sxh.py 
300 380 
370 371 


2.7.4 判断 素数 


本 例 将 接收 用 户 输 入 的 数字 ， 判 断 是 否 为 素数 。 

首先 来 看 下 什么 是 素数 : 素数 (prime number) 义 称 质数 ， 是 指 在 大 于 1 的 目 然 数 中 ， 除 了 1 
和 该 数 上 自身 外 ， 无 法 被 其 他 自然数 整除 的 数 (也 可 定义 为 只 有 1 与 该 数 本 号 两 个 因数 的 数 )。 

简单 来 说 ， 只 能 除 以 1 和 目 身 的 数 (需要 大 于 1T) 束 是 素数 。 举 个 例子 ， 对 于 $ 这 个 数 ， 从 2 
开始 一 直到 4， 都 不 能 被 5 整除 ， 只 有 1 和 它 本 号 (5) 才 能 被 5 整除 ， 所 以 ，5 就 是 一 个 典型 的 
素数 。 

那么 ， 要 想 计算 出 一 个 随机 数 是 不 是 素数 ， 用 Python 应 该 怎么 写 呢 ?首先 ， 第 一 条 语句 肯 
定 用 于 接收 用 户 输入 的 数字 : 


n=intinput(" 请 输入 一 个 数字 : ")) 


其 次 ， 要 计算 出 该 数 是 不 是 素数 ， 就 要 从 2 开始 一 直 除 到 该 数 之 前 的 那个 自然 数 ， 很 明显 
是 如 下 数字 范围 : 


for 1 mn ranee(2, n): 


在 循环 体 里 面 ， 每 次 循环 当然 就 是 要 判断 当 次 除法 是 否 能 整除 ， 这 里 可 以 使 用 求 模 运算 ， 
也 就 是 取 余 ， 当 余数 为 0 时 ， 该 数 就 不 是 素数 : 
fn%1i=—0: 


print("%d 不 是 一 个 素数 ! "%n) 
break 


这 里 break 的 意思 就 是 当 该 数 不 是 素数 时 ， 就 跳出 整个 循环 ， 该 数 不 是 想 要 的 数字 (本 例 涉 
及 的 循环 控制 结构 将 在 后 面 章 节 中 介绍 )。 

如 果 所 有 循环 迭代 都 完成 后 还 没有 找 出 能 整除 的 数 ， 那 么 可 以 判断 该 数 束 是 一 个 素数 : 

else: 

print("96d 是 一 个 素数 ! " % 双 ) 

此 时 所 有 代码 就 写 好 了 ， 不 过 为 了 看 起 来 简单 ， 没 有 髓 套 是 否 大 于 1 的 判断 ， 用 户 输入 的 
数字 默认 需要 大 于 1: 

n 二 int(input(" 请 输入 一 个 数字 : ")) 


for 1 m range(2. n): 
in%iQ— 0: 


print(" %d 不 是 一 个 素数 ! " % 
break 


else: 
print(" %d 是 一 个 素数 ! " % nn) 


这 里 要 细 细 品味 这 段 代 码 ，else 其 实 和 站 不 是 一 对 ， 而 是 和 for 并排， 第 见 的 是 正 ..else.. 
或 站 ...elif...else， 诸如此类, 但 其 实 for 也 可 以 和 else 搭配 出 现 。 在 这 段 代 码 里 ， 当 某 次 遍历 结 
果 的 余数 为 0 时 ，break 生效 ,循环 就 结束 了 了， 与 之 成 对 出 现 的 else 代码 也 束 不 执行 了 ; 当 所 有 
遍历 结束 后 ， 如 果 没 有 一 次 余数 为 0， 循环 束 转 到 else 开始 执行 ， 打 印 输出 “该 数 为 素数 ”。 

最 后 随便 输入 两 个 数字 ， 看 看 功能 有 没有 实现 : 

请 输入 一 个 数字 : 11 

11 是 一 个 素数 ! 

请 输入 一 个 数字 : 21 

21 不 是 一 个 素数 ! 


本 音 小 结 


本 章 介绍 的 是 Python 最 基础 的 语法 知识 .学 习 任何 一 门 语言 时 , 首先 要 了 解 该 语言 的 规范 、 
变量 、 对 象 、 数 据 类 型 、 表 达 式 等 ， 这 是 掌握 任何 一 门 语言 的 基础 ，Python 语言 也 不 例外 。 本 
章 首先 介绍 了 Python 语法 的 特点 ， 包 括 注释 、 代 码 规范 的 常识 。 然 后 介绍 了 Python 语言 本 身 
的 保留 字 以 及 标识 符 命名 规则 。 接 着 重点 介绍 了 变量 的 声明 ， 根 据 变 量 内 容 而 规定 的 变量 数据 
类 型 ， 基 本 变量 之 间 进 行 运算 的 常规 运算 符 (包括 算术 运算 符 、 比 较 运算 符 、 赋 值 运算 符 、 逻 辑 
运算 符 、 位 运算 符 、 成 员 运 算 符 、 身 份 运算 符 ) 以 及 运算 符 优先 级 。 最 后 介绍 了 如 何 楼 收 用 户 从 
键盘 输入 的 信息 ， 以 及 如 何 将 Python 编程 处 理 后 的 问题 结果 输出 以 呈现 给 用 户 。 

本 章 综合 运用 了 以 上 介绍 的 知识 ， 编 写 了 求 和 、 求 平方 根 、 求 水 仙 花 数 、 判 断 素数 这 几 个 
例子 ， 以 巩固 所 学 。 


思考 与 练习 


1. 举例 说 明 Python 编程 过 程 中 经 稼 用 到 的 注释 方式 。 

2. 如 何 查看 Python 中 的 保留 字 。 

3. 简单 描述 Python 标识 符 命 名 规则 。 

4. 有 以 下 脚本 : 

nfo = "abe' 

info[2]='d 

结果 是 什么 ， 为 什么 会 报错 呢 ? 

5. 如果 要 把 上 面 的 字符 串 变 量 info 里 面 的 c 替换 成 d， 要 怎么 操作 呢 ? 
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6. 有 下 面 两 个 变量 : 


六 本 中 一 中， 


b=2 


print(a+b) 的 结果 是 什么 ， 为 什么 会 出 现 这 个 结果 ， 如 果 和 希望 结果 是 3， 要 怎么 操作 ? 
7. 已 知 字符 串 s= "Lamulilei"， 请 用 两 种 办 法 取出 之 间 的 "am" 字 符 串 。 
8. 在 Python 中 ， 如 何 修改 字符 串 ? 

9. bool("2012" 一 2012) 的 结果 是 什么 ? 

10. 己 知 如 下 代码 : 

a 二 "中 文 编程 " 

b=a 

i | 

a 二 "Python 编程 " 

b=a.decodeCutf-8") 

d= "中 文 编程 " 

Le | 

c=b 

b2 = a.replace(" 中 ", "中 ") 


(1) 请 给 出 str 对 象 " 中 文 编程 "的 引用 计数 。 
(2) 请 给 出 str 对 象 "Python 编程 "的 引用 计数 。 


第 3 章 


字符 与 序列 


Python 中 党 用 的 序列 结构 有 列表 、 元 组 、 字 典 、 字 符 串 、 集 合 等 。 大 部 分 可 迭代 对 象 也 文 
持 类 似 于 序列 的 语法 ， 如 图 3-1 所 示 。 列 表 、 元 组 、 字 符 串 等 序列 类 型 以 及 range 对 象 均 支持 
双 回 索引 ， 第 一 个 元 素 的 下 标 为 0， 第 二 个 元 素 的 下 标 为 1， 以 此 类 推 。 可 以 使 用 负 整 数 作为 索 
引 是 Python 序列 的 一 大 特色 ， 熟 练 掌 握 和 运用 可 以 大 幅度 提高 开发 效率 。 


lle i 
< 
ES 


集合 


range、Zzip、map.、 
enumerate 


3-1 Python 序列 分 类 示意 图 


大 量 实 际 开发 经 验 表明 , 熟练 掌握 Python 基本 数据 结构 (尤其 是 序列 ) 的 用 法 可 以 更 加 快速 、 
有 效 地 解决 实际 问题 。 大 家 慢 慢 会 发 现 ， 实 际 工作 中 的 每 个 问题 最 终 部 可 以 通过 一 些 基本 数据 
结构 的 方法 或 内 置 函 数 来 解决 。 本 章 通过 大 量 实例 介绍 列表 、 元 组 、 字 典 、 集 合 等 儿 种 基本 数 
据 结构 的 用 法 ， 同 时 还 包括 range 对 象 、zip 对 象 以 及 enumerate 对 象 的 巧妙 应 用 ， 以 及 在 实际 
应 用 中 非常 有 用 的 列表 推导 式 、 切 上 户 操 作 、 生 成 侣 推导 式 等 。 


本 章 的 学 习 目标 : 
e 效 悉 字符 串 的 凋 用 操作 ， 包 括 字符 串 的 拼接 、 字 符 串 长 度 的 计算 、 截 取 字 符 串 、 分 隔 


和 合并 字符 串 、 检 索 字 符 串 、 字 和 母 大 小 写 转换 、 去 除 字符 串 中 的 空格 和 特殊 字符 、 格 
式 化 子 从 串 、 字 从 串 的 编码 和 解码 等 ; 
e 熟悉 第 用 序列 操作 ， 包 括 索 引 、 切 片 、 序 列 相 加 、 冬 法、 判断 菜 个 元 系 是 否 是 序列 成 


Python 蔓 础 教程 到 


员 、 计 算 序列 的 长 度 和 最 大 值 /最 小 值 等 : 
e 熟悉 列表 的 使 用 ， 包 括 列 表 的 创建 和 删除 、 访 问 列表 元 系 、 人 遍历 列表 、 列 表 元 系 的 增 
删改 操作 、 对 列表 进行 统计 计算 、 对 列表 进行 排序 、 列 表 推 导 式 、 二 维 列表 的 使 用 等 ; 
e。 效 悉 元 组 的 使 用 ， 包 括 元 祖 的 创建 和 删除 、 访 问 元 组 元 素 、 修 改元 组 元 素 、 元 组 推导 式 ; 
e 熟悉 字典 的 使 用 ， 包 括 字 典 的 创建 和 删除 、 字 典 的 访问 、 字 典 的 般 历 、 字 典 的 增删 改 


操作 ; 


。 熟悉 集合 的 使 用 ， 包 括 集 合 的 创建 、 集 合 的 增删 改 操作 、 沼 用 集合 运算 等 ; 
e 了 解 列 表 、 元 组 、 字 典 和 集合 的 区 别 。 


前 一 章 已 经 简单 介绍 了 字符 串 变 量 ， 了 解 了 一 些 基 本 操作 。 本 节 主 要 介绍 字符 串 对 象 的 和 


用 方法 ， 如 表 3-1 所 示 。 


方法 
Dame.stmp( 
name.strip( xx ) 
name.lstrip() 
name.rstrip() 
name.count( x') 
name.capitalize() 
name.center(n,-') 
name.find(x') 
name.index(x') 
name replace(oldstr, newstr) 
name.format() 


name.ftormat map(d 


S.startswith(prefix| .start[ .end | 
S.endswith(suffix| start[ .end||) 


S.1salnum() 
S.1salpha() 
S.1sdioit() 
S.isspace() 
S.1slower() 
S.isupper() 
S.1stitle() 
name.spht() 
name.split(,") 
', .jon(slit) 
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表 3-1 字符 串 对 象 的 常用 方法 


功能 
去 卸 空 格 和 换行 符 
去 掉 某 个 字符 串 
去 掉 左边 的 空格 和 换行 符 
去 掉 右 边 的 空格 和 换行 符 
得 找 某 个 字符 在 字符 串 里 面 出 现 的 次 数 
自 字 母 大写 


把 字符 串 放 中 间 ， 两 边 用 - 补 齐 

找到 这 个 字符 后 返回 下 标 ， 多 个 时 返回 第 一 个 ;不 存在 的 字符 返回 - 1 
找到 这 个 字符 后 返回 下 标 ， 多 个 时 返回 第 一 个 ;不 存在 的 字符 报错 
字符 串 蔡 换 

字符 串 格 式 化 

字符 串 格 式 化 ， 传 递 进去 的 是 一 个 字典 

是 否 以 prefix 开头 

是 否 以 suffix 结尾 

是 否 全 是 字母 和 数字 ， 并 至 少 有 一 个 字符 

是 否 全 是 字母 ， 并 至 少 有 一 个 字符 

是 否 全 是 数字 ， 并 至 少 有 一 个 字符 

是 否 全 是 空白 字符 ， 并 至 少 有 一 个 字符 

S 中 的 字母 是 否 全 是 小 写 

S 中 的 字母 是 否 全 是 大 写 

S 是 否 首 字母 大 写 

按照 逗号 分 隔 

用 逗号 连接 slit， 变 成 一 个 字符 串 ，slit 可 以 是 字符 、 列 表 、 字 典 (可 和 代 
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对 象 )。int 类 型 不 能 被 连接 


下 面 重 点 讲解 字符 串 长 度 的 获取 、 字 母 大 小 写 转换 、 字 符 串 的 分 陋 与 拼接 、 字 符 串 得 找 、 
字符 哩 蔡 换 、 统 计 单 词 个 数 、 格 式 化 字符 串 、 字 符 串 的 编码 与 解码 等 。 


3.1.1 计算 字符 串 的 长 度 
len0 方 法 返回 对 象 (字符 、 列 表 、 元 组 等 ) 长 度 或 项 目 个 数 。 语 法 格式 如 下 : 
len( s ) 


参数 s 为 要 计算 长 度 的 字符 串 、 列 表 、 字 典 、 元 组 等 。Python 在 计算 字符 串 长 度 时 ， 一 个 
中 文字 符 算 两 个 字符 ， 首 先 转换 成 utf8， 人 然后 通过 计算 utf-8 的 长 度 和 len0 方 法 取得 的 长 度 ， 
进行 对 比 即 可 知道 字符 串 内 中 文字 符 的 数量 ， 上 自然 束 可 以 计算 出 字符 串 的 长 度 了 。 例 如 : 

value=u' 肢 本 12， 

leneth = len(value) 

utf8 length = len(value.encode('uti-8")) 

leneth = (utf® lenegth - length)/2 + leneth 

print(length) 

执行 以 上 程序 ， 结 果 输 出 6。 
3.1.2 ”字母 的 大 小 写 转换 


和 其 他 语言 一 样 ，Python 为 字符 串 对 象 提供 了 转换 大 小 写 的 方法 : upper0 和 lower0。 不 止 
这 些 ，Python 还 提供 了 首 字 母 大 写 其 余 字 母 小 写 的 capitalize0 方 法 ， 以 及 所 有 单词 首 字 母 大 写 
其 余 字母 小 写 的 title0 方 法 。 示 例 程序 如 下 : 


s= TElo pYthon' 

print(s.upperO) 

print(s.lowerO) 

print(s.capitalizeO) 

prnt(s.tileO) 

执行 以 上 代码 ， 输 出 结果 如 下 : 
HELLO PYTHON 

hello python 

Hello python 

Hello Python 


Python 提供 了 isupperO、islowerO、istitle0 方 法 来 判断 字符 串 的 大 小 写 。 需 要 注意 的 是 : 

se Python 没有 提供 iscapitalize0 方 法 。 

e ”如果 对 空 字符 串 使 用 isupperO0、islowerO、istitle0 方 法 ， 返 回 的 结果 都 为 False。 代 码 
如 下 : 


prnt(A'.isupper() ) 并 ITUe 


print(A'.islower()) #FEalse 
print(Python Is So Good'.1stitle()) #1Ire 


3.1.3 ”字符 串 的 分 隔 


Python 中 的 字符 串 有 两 种 取 值 顺序 。 一 是 从 左 到 右 索引 ， 默 认 从 0 开始， 最 大 范围 是 字符 
串 的 长 度 减 1， 例 如: 


s = "lovepython' 

s[0] 的 结果 是 i。 

二 是 从 右 到 左 索引 ， 默 认 从 - 1 开始 ， 最 大 范围 是 字符 串 开 头 ， 例 如 以 上 字符 串 中 ，s[ - 1] 
的 结果 是 n。 


以 上 方法 利用 于 从 一 个 字符 串 中 取得 一 个 字符 ， 如 果 要 取得 字符 串 中 的 名 干 连续 字符 ， 可 
以 使 用 索引 区 间 标 识 ， 例 如 针对 上 面 的 字符 串 s，s[1:5] 的 结果 是 love。 

由 此 可 见 ， 当 使 用 以 冒号 分 隔 的 字符 串 时 ，Python 返回 一 个 新 的 对 象 ， 结 果 包 含 了 以 这 对 
偏 移 标识 的 连续 的 内 容 ， 包 含 下 边界 ， 比 如 上 面 的 结果 包含 s[1] 的 值 ]， do hen 
括 上 边界 ， 在 上 面 的 例子 中 也 就 是 s[5] 的 值 p。 示 例如 下 : 


str='"0123456789" 

print str[0:3] # 截 取 第 一 位 到 第 三 位 的 字符 

print str[:] ”# 截 取 字 符 串 的 全 部 字符 

print str[6:] # 截 取 第 七 位 到 结尾 的 所 有 字符 

print str[: - 3] # 截 取 从 头 开始 到 倒数 第 三 个 字符 之 前 的 所 有 字符 
print str[2] # 截 取 第 三 个 字符 

print str[ - 1] 。 # 截 取 倒数 第 一 个 字符 

print str[:: - 1] # 造 一 个 与 原 字符 串 顺序 相反 的 字符 串 
print str[ - 3: - 1] # 截 取 倒 数 第 三 位 到 倒数 第 一 位 的 字符 
print st[ - 3:]  # 截 取 倒 数 第 三 位 到 结尾 的 所 有 字符 
print str[: - $: - 3] # 逆 序 截取 


Python 还 提供 了 专门 用 于 截取 特定 区 间 字 符 的 split0 函 数 。 
split0 通 过 指定 分 隔 符 对 字符 串 进行 切片 ， 如 果 参 数 num 有 指定 值 ， 则 仅 分 隔 num 个 子 字 
从 串 。split0 函 数 的 语法 格式 如 下 : 


str.split(stt="", num=strine.count(str)). 


其 中 ， 参 数 str 为 分 隔 符 ， 默 认为 所 有 的 空 字 符 ， 包 丘 空 格 、 换 行 符 CD)、 制 表 符 0 等 ， 参 
数 num 为 分 隔 次 数 。 访 图 数 返 回 分 隔 后 的 字符 串 列 表 。 示 例如 下 : 


# 定 义 一 个 字符 串 strl 

>>> strl = "3wW.gorly.test.com.cn" 
# 使 用 默认 分 隔 符 分 隔 字符 串 strl 
>>> prmt strl1.spht() 
[3w.gorly.testcomLcn |] 


# 指 定 分 隔 符 为 .， 分 隅 字符 串 strl 
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>>> print strl.split(".") 

[3w., 'gorly", test com cn | 

# 指 定 分 隔 符 为 .， 并 且 指 定 分 隔 次 数 为 0 次 
>>> prmt strl.spht( 0) 

[3w.gorly.test.com.cn |] 

# 指 定 分 隔 符 为 .， 并 且 指 定 分 隔 次 数 为 1 次 
>>> prmt strl.sphit(.",1) 

[3w', 'gorly.test.com.cn'| 

# 指 定 分 隔 符 为 .， 并 且 指 定 分隔 次 数 为 2 次 
>>> primnt strl.split(.",2) 

[3w. 'gorly', testcomcn | 

# 这 种 分 隔 等 价 于 不 指定 分 隔 次 数 的 情况 
>>> print str].split(.",-1) 

[3wW 'gorly", test com cn | 

# 指 定 分 隔 符 为 .， 并 取 序 列 下 标 为 0 的 项 
>>> prmnt strl.Spht(…)[O| 

3W 

# 指 定 分 隔 符 为 .， 并 取 序 列 下 标 为 4 的 项 
>>> prmnt strl1.sphlt(…)[4| 

cn 


3.1.4 字符 串 的 拼接 


Python 中 字符 串 拼接 的 常用 操作 方式 主要 有 7 种 ， 分 别 是 来 自 C 语言 的 % 方 式 、formatO 
拼接 方式 、0 类 似 元 组 方式 、 面 同 对 象 模 板 拼 接 、 常 用 的 + 号 方式 、join0 拼 接 方式 以 及 fstring 
为 去。 

字符 串 拼 接 就 是 将 多 个 字符 串 合并 成 一 个 字符 串 。 从 实现 原理 上 划分 ， 可 将 7 种 字符 串 拼 
接 方 式 划 分 成 以 下 3 种 类 型 。 

e 格式 化 类 : %、format0、 面 同 对 象 模板 拼接 

e 拼接 类 : +、0、join0 

e 插值 类 : fstring 

拼接 长 度 不 超过 20 时 ， 选 用 + 号 方式 ， 当 需要 处 理 字符 串 列 表 等 序列 结构 时 ， 采 用 jom0 
方式 ; 对 于 长 度 超过 20 的 情况 , 高 版 本 选用 fstring 方式 , 低 版 本 时 看 情况 使 用 format0 或 joinO0 
为 式 。 

下 面 分 别 对 这 7 种 字符 串 拼 接 方式 进行 详细 介绍 。 


1. 来 自 C 语言 的 % 方 式 
这 种 拼接 方式 的 示例 代码 如 下 : 


>>> print(%s %s' % (‘Hello', world7) 
Hello world 


% 方 式 继承 于 CC 语言 。%s 是 一 个 占 位 符 ， 它 仅 代 表 一 段 字 符 串 ， 并 不 是 拼接 的 实际 内 容 。 
实际 拼接 的 内 容 在 单独 的 % 后 面 ， 放 在 一 个 元 组 里 。 
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类 似 的 占 位 符 还 有 %d( 代 表 一 个 整数 )、%ft 代 表 一 个 浮 点 数 )、%x( 代 表 一 个 十 六 进 制 数 )， 


等 等 。% 占 位 符 既 是 这 种 拼接 方式 的 特点 ， 同 时 也 是 限制 因素 ， 因 为 每 种 占 位 得 都 有 特定 意义 ， 
实际 使 用 起 来 太 盾 烦 了 。 


2. format() 拼 接 方式 
format0 拼 接 方式 的 示例 代码 如 下 : 


# 简洁 版 

>>> sl = 'Hello f}! My name is {}'.format( World', Python 猫 ") 
>>> print(s1) 

Hello World! My name is Python 猫 

# 对 号 入 座 版 

>>> s2 = 'Hello {0}! My name is {1Y'.format(World', 'Python 猫 ") 
>>> s3 = 'Hello {namel}! My name is {name2}'.format(name1="World', name2='Python 猫 ') 
>>> print(s2) 

Hello World! My name is Python 猫 

>>> print(s3) 

Hello World! My name is Python 猫 


这 种 方式 使 用 花 括 号 介 作 为 占 位 符 ， 在 format0 方 法 中 再 转 入 实际 的 拼接 值 。 很 容易 看 出 ， 


这 实际 上 是 对 % 拼 接 方 式 的 改进 。 这 种 方式 在 Python 2.6 中 开始 引入 。 


上 例 中 ， 简 滞 版 的 花 括号 中 无 内 容 ， 缺 点 是 容易 弄 错 次 序 。 对 号 入 座 版 主要 有 两 种 ， 一 种 


传 入 序列 号 ， 另 一 种 则 使 用 键 - 值 对 的 方式 。 实 战 中 ， 我 们 更 推荐 后 一 种 ， 既 不 会 数 错 次 序 ， 又 
更 直观 可 读 。 


3. () 类 似 元 组 方式 
对 于 0 类 似 元 祖 方 式 的 字符 串 拼 接 操作 ， 示 例 程序 如 下 : 


>>> s tple=(Helo. world) 
>>>S like tuple = (Hello' '' world ) 
>>> print(s tuple) 

(Hello', ''. world’) 

>>> print(s like tuple) 

Hello world 

>>> type(s like tuple) 

<class 'str> 


注意 ， 上 例 中 s_like_tuple 并 不 是 一 个 元 组 ， 因 为 元 素 间 没有 逗号 分 阳 符 ， 这 些 元 素 间 可 以 


用 空格 分 阳 ， 也 可 以 不 要 空格 。 使 用 type0 合 看 ， 你 会 友 现 它 束 是 sf 类 型 。 


这 种 方式 看 起 来 很 快捷 ， 但 是 要 求 括号 内 的 元 系 是 真实 字 付 串 ， 不 能 混用 变量 ， 所 以 不 够 


天 活 。 不 例如 下 : 


# 多 元 紊 时， 不 文 持 有 变量 
>>> str 1 ='Hello' 
>>> str 2= (str 1 World) 
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Flle "<stdm>", lme 1 
str 2= (str 1 world') 


>>> str 3=(str 1 str 1) 
File "<stdm>", line 1 
str 3=(str 1 str 1) 


SyntaxError: mvalid syntax 
# 但 是 下 面 的 写法 不 会 报错 
>>> str 4= (str 1) 


4. 面向 对 象 模板 拼接 

对 于 面向 对 象 模板 拼接 方式 ， 示 例 程序 如 下 : 
>>> from strne import Template 

>>> s= Template(${s1} ${s2}!") 


>>> print(s.safe substitute(s1='Hello',s2="World")) 
Hello world! 


实际 应 用 中 ， 和 字符 串 的 这 种 拼接 方式 使 用 比较 少 ， 因 此 并 不 推荐 。 

5. 常用 的 + 号 方式 

使 用 加 号 (Ch 来 拼接 右 干 字 符 串 ， 是 最 弟 用 的 字符 串 拼 接 方式 ， 示 例 程序 如 下 : 
>>> str 1 ='Hello world! 

>>> sr 2 = "My name is Python 猫 ' 

>>> print(str 1 + str 2) 

Hello world! My name is Python 猫 


>>> print(str 1) 
Hello world! 


这 是 最 常用 的 字符 串 拼 接 方式 。 但 是 ， 这 种 方式 存在 两 处 让 人 容易 犯错 的 地 方 。 

首先 ， 新 学 编程 的 同学 容易 犯错 ， 由 于 不 知道 字符 串 是 不 可 变 类 型 ， 新 的 字符 串 会 独占 一 
块 新 的 内 存 ， 而 原来 的 字符 串 保持 不 变 。 上 例 中 ， 拼 接 前 有 两 段 字符 串 ， 拼 接 后 实际 有 三 段 字 
从 串 。 

其 次 ， 有 经 验 的 程序 员 也 容易 犯错 ， 他 们 以 为 当 拼 接 次 数 不 超过 3 时 ， 使 用 + 号 方式 就 会 
比 其 他 方式 快 ， 但 这 没有 任何 合理 依据 。 

事实 上， 在 拼接 短 的 字面 值 时 ， 由 于 CPython 中 的 常数 折 琶 (constant folding) 功 能 ， 这 些 字 
面值 会 被 转换 成 更 短 的 形式 ， 例 如 'at'b'+e' 被 转换 成 abc'，mhelloHworld' 也 会 被 转换 成 hello 
world'。 这 种 转换 是 在 编译 期 间 完 成 的 ， 而 到 了 运行 时 ， 就 不 会 再 发 生 任何 拼接 操作 ， 因 此 会 加 
快 整体 的 计算 速度 。 

常数 折 生 功能 要 求 拼接 结果 的 长 度 不 超过 20。 所 以 ， 当 拼接 的 最 终 字 符 串 长 度 不 超过 20 
时 ，+ 号 方式 会 比 后 面 提 到 的 join0 等 方式 快 得 多 ， 这 与 + 号 的 使 用 次 数 无 关 。 


6. join() 拼 接 方式 


+ 号 拼接 方式 适用 于 短 字符 串 的 拼接 ， 当 拼接 的 字符 串 长 度 超过 20 时 ， 最 好 使 用 join0 拼 
接 方式 。 

str 对 象 目 市 的 join0 方 法 接收 一 个 序列 参数 ， 可 以 实现 拼接 。 例 如 : 

>>> str list = [Hello', world | 

>>> str ]oml =" "Jom(str list) 

>>> str Jom2 = "~.Jom(str list) 

>>> print(str jom]) 

Hello world 

>>> print(str Jom2) 

Hello-world 

可 以 看 出 ， 这 种 方式 比较 适合 于 连接 序列 对 象 (例如 列表 ) 中 的 元 素 ， 并 设置 统一 的 分 隔 符 。 
南 要 注意 的 是 ， 在 做 拼接 时 ， 元 紊 右 不 是 字符 串 ， 南 要 先 转换 一 下 。 

join0 拼 接 方式 的 缺点 是 ， 不 适合 进行 零散 片段 的 、 不 属于 序列 或 集合 的 元 素 的 拼接 。 


7. fstring 方式 


他 string 方式 出 目 PEP 498(Literal String Intempolation， 字 面 字 符 串 插值 )， 目 Python 3.6 版 本 
开始 引入 。 特 点 是 在 字符 串 前 加 f 标识 ， 在 字符 串 中 间 则 用 花 括 号 弛 包 于 其 他 字符 串 变 量 。 示 
例 程序 如 下 : 


>>> name = "World' 

>>> myname = 'python cat 

>>> words = fHello {name}. My name 1s {myname}. 

>>> print(words) 

Hello world My name 1s python cat. 

f-string 方式 在 可 读 性 上 远 远 强 过 format0 方 式 ， 处 理 长 字符 串 的 拼接 时 ， 速 度 与 join0 方 式 
相当 。 


3.1.5 ”字符 串 查 找 


find0 方 法 用 来 检测 字符 串 中 是 否 包 含 子 字符 串 st， 如 果 指 定 beg( 开 始 ) 和 end( 结 束 ) 范 围 ， 
则 检查 是 否 包含 在 指定 范围 内 。 如 果 在 指定 范围 内 包含 指定 的 索引 值 ， 返 回 索 引 值 在 字符 串 中 
的 起 始 位 置 ， 如 果 不 包 含 指定 的 索引 值 ， 返 回 - 1。 

find0 方 法 的 语法 格式 如 下 : 


str.find(str, bee—0, end=len(string)) 


其 中 ，str 表示 指定 检索 的 字符 串 ; beg 表示 开始 索引 ， 默 认为 0; end 表示 结束 索引 ， 默 认 
为 字符 串 的 长 度 。find0 方 法 的 返回 结果 为 子 串 所 在 位 置 的 最 左 端 索引 ， 如 果 没 有 找到 ， 则 返回 
- 1。 示例 程序 如 下 : 


>>> strl = "Runoob example....Wwow!!!" 
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>>> str2 = "exam" 

>>> print (strl.find(str2)) 

7 

>>> print (strl.find(str2. 5)) 
7 

>>> print (strl.find(str2, 10)) 
-| 


从 输出 结果 可 以 看 出 ， 如 果 找 到 字符 串 ， 束 返回 对 应 的 索引 值 ， 人 否则 返回 - 1。 


注意 : 
字符 串 的 fmnd0 方 法 返回 的 不 是 布尔 值 。 如 果 返 回 0， 就 表示 在 索引 0 处 找到 了 子 字 符 串 。 


3.1.6 ”字符 串 替换 


replace0 方 法 用 于 把 字符 串 中 的 old( 旧 字符 串 ) 蔡 换 成 new( 新 字符 串 )， 如 果 指 定 第 三 个 参数 
max， 则 替换 不 超过 max 次 。 
replace0 方 法 的 语法 格式 如 下 : 


strTeplace(old new[. max]) 


其 中 ， 参 数 old 指 的 是 将 被 蔡 换 的 于 字符 串 ;， 参数 new 是 一 个 新 字符 串 ， 用 于 蔡 换 old 于 
字符 串 ; 参数 max 为 可 选 字符 串 ， 蔡 换 不 超过 max 次 。 该 方法 的 返回 结果 是 字符 串 中 的 old( 旧 
字符 串 ) 被 耕 换 成 new( 新 字符 串 ) 后 生成 的 新 字符 串 ， 如 果 指 定 第 3 个 参数 max， 则 丛 换 不 超过 
max 1 多。 

示例 程序 如 下 : 

>>> str = "this 1s string example....wow!!! this 1s really strme" 

>>> print(str.replace("is"."Was")) 

thwas Was strine example....wow!!! thwas was really strms 

>>> print(str.replace("1s","Wwas".3)) 

thwas Was string example....wow!!! 也 Was 1s really strne 

由 输出 结果 可 以 看 出 ， 当 不 指定 第 三 个 参数 时 ， 所 有 匹配 字符 都 痊 换 ， 当 指定 第 三 个 参数 
时 ， 蔡 换 从 左 往 右 进行 ， 蔡 换 不 超过 指定 次 数 。 


3.1.7 ”统计 字符 出 现 次 数 

countO 方 法 用 于 统计 字符 串 里 某 个 字符 出 现 的 次 数 。 可 选 参数 是 在 字符 串 中 进行 搜索 的 开 
始 与 结束 位 置 。countO0 方 法 的 语法 格式 如 下 : 

str.count(sub, start= 0,end—len(strme)) 


其 中 ， 参 数 sub 指 的 是 搜索 的 子 字符 串 。 参 数 start 指 的 是 搜索 的 开始 位 置 ， 默 认为 第 一 个 
字符 ， 第 一 个 字符 的 索引 值 为 0。 参 数 end 指 的 是 搜索 的 结束 位 置 ， 默 认为 字符 串 的 最 后 一 个 
字符 位 置 
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count0 方 法 的 返回 结果 是 子 字 符 串 在 字符 串 中 出 现 的 次 数 。 示 例 程序 如 下 : 


>>> str = "this ls string example....Wow!" 

>>> gb= "1" 

>>> print("str.count(sub, 4. 40):", str.count(sub., 4. 40)) 
str.count(sub, 4. 40): 2 /字符 1 在 str 字符 串 中 出 现 了 两 次 
>>> sb = "Wow" 

>>> prnt("str.count(sub):",str.count(sub)) 

str.count(sub): 1 ”// 字 符 串 "wow" 在 str 字符 串 中 出 现 了 一 次 


3.1.8 ”去除 字 符 串 中 的 空格 和 特殊 字符 


实际 项 目 开 发 中 ， 在 处 理 字 符 串 时 经 和 常 过 到 很 多 空格 的 问题 ， 一 个 一 个 地 手动 删除 不 是 我 
们 程序 员 应 该 做 的 事情 ，Python 内 置 了 以 下 去 除 空格 的 方法 : lstrip0、IrstripO0、strip0。 

lstrip0 方 法 用 于 删除 学 符 串 左 边 的 空格 ， 即 删除 字符 串 开 始 位 置 前 的 空格 。 示 例 代 码 如 下 : 

>>> str=" Nicholas " 

>>> str.lstripO 

"Nicholas 


从 输出 结果 可 见 ， 字 得 串 左 侧 的 空格 串 被 删除 了 ， 右 侧 的 空格 串 还 保留 着 。 
rstrip0 方 法 用 于 删除 学 符 串 右边 的 空格 ， 即 删除 学 符 串 末尾 的 所 有 空格 。 示 例 程序 如 下 : 


>>>str=" Nicholas " 

>>> str.rstrip() 

” Nicholas' 

从 输出 结果 可 见 ， 字 符 串 右 侧 的 空格 串 被 删除 了 ， 左 侧 的 空格 串 还 保留 着 。 

strip0 方 法 用 于 删除 字符 串 两 端的 空格 。 比 如 上 面 的 字符 串 str 两 边 都 有 空格 ， 如 果 需 要 同 
时 删除 两 侧 的 空格 ， 使 用 strip0 方 法 最 方便 。 示 例 代 码 如 下 : 

>>> str=" Nicholas " 


>>> str.stripO 
"Nicholas' 


3.1.9 格式 化 字符 串 


许多 编程 语言 中 都 有 格式 化 字符 串 的 功能 , 如 C 和 Fortran 语 言 中 的 格式 化 输入 输出 ,Python 
内 置 有 对 字符 串 进行 格式 化 的 操作 %。 

格式 化 字符 串 时 ，Python 使 用 一 个 字符 串 作 为 模板 。 模 板 中 有 格式 待 ， 这 些 格 式 竺 为 真实 
值 预 留 位 置 ， 并 说 明 真 实 值 应 该 呈现 的 格式 。Python 用 一 个 元 组 将 多 个 值 传递 给 模板 ， 每 个 值 
对 应 一 个 格式 符 。 示 例 程序 如 下 : 


pnnt(Tm %%s. Tm ood year old" % (Vame1', 99)) 


上 面 的 例子 中 , "Tim %s. Tm %d year old” 为 模板.%s 为 第 一 个 格式 符 , 表示 一 个 字符 串 。%d 
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为 第 二 个 格式 符 ， 表 示 一 个 整数 。(Vamei'，99) 的 两 个 元 素 "Vamei' 和 99 为 蔡 换 %s 和 %d 的 真实 
值 。 在 模板 和 元 组 之 间 ， 用 一 个 % 分 了 喇 ，% 代 表 了 格式 化 操作 。 

整个 "Tm %s. Tm %d year old" % (Vamei', 99) 实 际 上 构成 一 个 字符 串 表达 式 。 可 以 像 正 常 的 
字 和 从 串 那 样 ， 将 它 赋 值 给 菜 个 变量 。 例 如 : 

a= "Tm %s. Tm %d year old" % ("Vame!l, 99) 

print(a) 

还 可 以 用 词典 来 传递 真实 值 ， 例 如 : 

pnt(Tm ?onamejs.Tm %(age)d year old" % {name':Vamel, age :991 

可 以 看 到 , 对 两 个 格式 符 进 行 了 命名 。 命名 使 用 圆 括 号 括 起 来 。 每 个 命名 对 应 词典 的 一 个 键 。 

格式 符 为 真实 值 预 留 位 置 ， 并 控制 显示 的 格式 。 格 式 符 可 以 包含 一 个 类 型 码 ， 用 以 控制 显 
示 的 类 型 。 常 用 的 格式 符 如 表 3-2 所 示 。 


表 3-2 常用 的 格式 符 


格式 符 作用 
oos 字符 串 ( 采 用 str0 方 法 的 返回 值 ) 
oor 字符 串 (采用 repr0 方 法 的 返回 值 ) 
oc 单个 字符 
%ob 二 进 制 整 数 
%od 十 进 制 整数 
oi 十 进 制 整数 
900 八进制 整数 
Vox 十 六 进 制 整 数 
oe 指数 (基底 写 为 日 
%E 指数 (基底 写 为 EE) 
of 浮 点 数 
%F 浮 点 数 ， 与 上 相同 
%0g 指数 (e 或 浮 点 数 (根据 显示 长 度 ) 
%G 指数 (E) 或 浮 点 数 (根据 显示 长 度 ) 
9%006 字符 "%o" 


可 以 用 如 下 方式 对 格式 进行 进一步 的 控制 : 

%o[(name)|tasgsj[wadth|.[preclslonjtypecode 

参数 name 为 命名 。 参 数 flags 可 以 是 +、- 、' 或 0。+ 表 示 右 对 齐 。 - 表示 左 对 齐 。' 为 一 
个 空格 ， 表 示 在 正 数 的 左 侧 填 充 一 个 空格 ， 从 而 与 负数 对 齐 。0 表示 使 用 0 填充 。 参 数 width 
表示 显示 宽度 。 参 数 precision 表示 小 数 点 后 精度 。 例 如 : 

print("%+10x" % 10) 


print("%04d" % 5) 
print("%6.3f" % 2.3) 


Python 墅 础 仅 程 E>、 


上 面 的 width、precision 参数 为 两 个 整数 。 可 以 利用 * 来 动态 代入 这 两 个 参数 。 例 如 : 
print("%6.*f" 96 (4. 1.2)) 


Python 实际 上 用 4 蔡 换 *， 所 以 实际 的 模板 为 "%6.4f"。 
由 此 可 见 ，Python 内 置 的 % 操 作 符 可 用 于 格式 化 字符 串 操作 ， 控 制 字符 串 的 呈现 格式 。 
Python 中 还 有 其 他 的 格式 化 字符 串 的 方式 ， 但 % 操 作 符 的 使 用 是 最 为 方便 的 。 


3.1.10 ”encode() 和 decode() 方 法 


字符 串 在 Python 内 部 的 表示 为 Unicode 编码 , 因此 , 在 做 编码 转换 时 , 通常 需要 以 Unicode 
作为 中 间 编 码 ， 先 将 其 他 编码 的 字符 串 解 公 (decode) 成 Unicode, 再 从 Unicode 编码 (encode) 成 另 
一 种 编 公 。 

decode0 方 法 的 作用 是 将 其 他 编码 的 字符 串 转换 成 Unicode 编码 ， 如 strl.decode('gb2312")， 
表示 将 gb2312 编码 的 字符 串 strl 转换 成 Unicode 编码 。 

encode0 方 法 的 作用 是 将 Unicode 编码 转换 成 其 他 编码 的 字符 串 ， 如 str2.encode('gb2312"， 
表示 将 Unicode 编码 的 字符 串 str2 转换 成 gb2312 编码 。 

总 之 ， 要 想 将 其 他 编码 转换 成 utE8， 必 须 先 解码 成 Unicode， 再 重新 编码 成 utfE8， 这 以 
Unicode 为 转换 媒介 。 例 如 : 


一 中文 


如 果 是 在 utf8 文件 中 ， 字 符 串 就 被 编码 为 utf8; 如 果 是 在 gb2312 文件 中 ， 则 被 编码 为 
gb2312。 这 种 情况 下 ， 进 行 编码 转换 时 ， 都 需要 先 用 decode0 方 法 将 其 转换 成 Unicode 编码 ， 
再 使 用 encode0 方 法 将 其 转换 成 其 他 编码 。 通 常 ， 在 没有 指定 特定 的 编码 方式 时 ， 使 用 的 都 是 
由 系统 默认 编码 创建 的 代码 文件 。 例 如 : 


s.decode('utf-8").encode(‘utf-8") 


isinstance(s,unicode) 方 法 用 于 判断 s 是 否 为 Unicode 编码 。 如 果 是 ， 就 返回 Tme， 否 则 返回 
False。 例 如 : 


一 中文 

s=s.decode(‘utf-8") # 尾 utf-8 解码 成 Unicode 
print(isinstance(s.unicode)) ”# 此 时 输出 的 就 是 True 
s=s.encode('utf-8") # 又 将 Unicode 编码 成 utf-8 


print(isinstance(s.unicode)) ”# 比 时 输出 的 就 是 False 


序列 


在 Python 中 ， 最 基本 的 数据 结构 就 是 序列 (Sequence)。Python 包含 6 种 内 建 序 列 : 列表 、 
元 组 、 字 符 串 、Unicode 字符 串 、buffer 对 象 和 xrange 对 象 。 
在 讲解 列表 和 元 组 之 前 ， 本 节 先 介绍 Python 中 序列 的 通用 操作 ， 这 些 操作 在 列表 和 元 组 中 
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都 会 用 到 。 
Python 中 的 所 有 序列 都 可 以 进行 一 些 通 用 的 操作 ,包括 索引 (ndexing)、 分 片 (slicing)、 序列 
相 加 (adding)、 序 列 乘法 (multiplying)、 成 员 资 格 、 长 度 、 最 小 值 和 最 大 值 。 


3.2.1 索引 


序列 是 Python 中 最 基本 的 数据 结构 。 为 序列 中 的 每 个 元 素 分 配 一 个 数字 ， 代 表 它 在 序列 中 
的 位 置 (索引 )， 第 一 个 索引 是 0， 第 二 个 索引 是 1， 以 此 类 推 。 

序列 中 的 所 有 元 素 都 是 有 编号 的 ， 从 0 开始 递增 。 可 以 通过 编号 分 别 对 序列 的 元 素 进 行 访 
问 。 前 面 介 绍 字 符 串 时 已 经 介绍 过 通过 索引 获取 字符 或 字符 串 。 例 如 : 


>>> greeting = hello 
>>> greeting[0] 
巾 ， 
>>> grectng[1] 
ie 
>>> grectitngl2| 
由 
可 以 看 到 , 序列 中 的 元 系 从 0 开始， 从 左 回 右 按 照 上 自然 顺序 编号 , 元 系 可 以 通过 编号 访问 。 
获取 元 素 的 方式 为 : 在 变量 后 加 中 括号 ， 在 中 括号 中 输入 所 要 获取 元 素 的 编号 。 这 里 的 编号 就 
是 索引 ， 可 以 通过 索引 获取 元 素 。 所 有 序列 都 可 以 通过 这 种 方式 进行 索引 。 
除了 从 左 往 右 按照 编号 取 值 ， 也 可 以 从 右 往 左 取 值 ， 例 如 : 


>>> greetine = hello 

>>> greetng|-1] 

0 

>>> greeting[-2] 

下 
可 以 看 到 ，Python 中 的 序列 也 可 以 从 右 开 始 索 引 ， 最 右边 元 素 的 索引 值 为 - 1， 从 右 往 左 
在 Python 中 , 从 左 回 右 索引 称 为 正 数 索引 ， 从 右 回 左 索引 称 为 负数 索引 。 使 用 负数 索引 时 ， 

会 从 最 后 一 个 元 素 开 始 计数 ， 最 后 一 个 元 素 的 位 置 编号 为 - 1。 


一 


切片 也 称 为 分 片 。 索 引用 来 对 单个 元 素 进行 访问 ， 分 片 则 通过 冒号 相隔 的 两 个 索引 来 实现 
(前 和 面 讲解 字符 串 时 也 曾 提 到 过 )。 示 例 程序 如 下 : 


>>> mumber[1:3| 
区 3 

>>> number[-3:-1| 
[8.9| 


> > number = [1 2 ,4,3,6,7, 8.9.10| 


由 结果 可 以 看 出 ， 分 片 操 作 既 支持 正 数 索 引 ， 也 支持 负数 索引 ， 并 且 对 于 提取 序列 的 一 部 
分 很 方便 。 

分 片 操作 需要 提供 两 个 索引 作为 边界 ， 第 一 个 索引 的 元 系 包 含 在 分 片 内 ， 第 二 个 索引 的 元 
系 不 包含 在 分 片 内 。 对 于 上 面 的 示例 , 假设 需要 访问 最 后 3 个 元 素 ， 使 用 正 数 索引 可 以 这 样 与 : 

>>> mumber = [1,2,3,4,5,6,7,8,9,10] 


>>> nmumber[7:10| 
[8. 9. 10] 


由 此 可 以 看 出 ，number 的 编号 最 大 应 该 是 9， 编号 10 指 同 第 11 个 元 素 ， 这 是 一 个 不 存在 
的 元 素 。 
如 果 需 要 取得 的 分 片 包括 序列 的 结尾 元 亲 ， 只 需要 将 第 二 个 索引 设置 为 空 即 可 。 示 例如 下 : 


>>> number = [1.2,3,4,5.6,7.8.9.,10| 

>>> mumber[-3:| 

[8. 9. 10] 

正 数 索引 也 可 以 使 用 这 种 方式 取 值 ， 示 例如 下 : 

>>> mumber[0:| 

[1,2, 3, 4, 5, 6, 7., 8, 9, 10| 

>>> nmber|:0|] 

Ml 

>>> mumber|[:3| 

Be 

>>> mmber[:] 

[1,2,3,4,5,6,7.8,9.,10| 

进行 分 片 时 ， 分 片 的 开始 位 置 和 结束 位 置 都 需要 指定 ， 用 这 种 方式 获取 连续 的 元 系 没 有 问 
题 。 但 要 获取 序列 中 不 连续 的 元 条 就 比较 有 打 烦 ， 或 者 直接 不 能 操作 。 例 如 ， 要 获取 序列 number 


中 的 所 有 奇数 ， 以 一 个 序列 展示 出 来 ， 用 前 面 的 方法 就 不 能 实现 了 。 

对 于 上 和 面 这 种 情况 ，Python 提供 了 另 一 个 参数 : 步 长 。 在 普通 分 请 中 ， 步 长 默认 为 1。 分 
片 操 作 就 是 按照 这 个 步 长 逐个 所 历 序列 的 元 系 ， 亿 历 后 返回 开始 和 结束 位 置 之 间 的 所 有 元 系 。 
例如 : 


>>> mumber[f0:10:1| 
[1,2, 3, 4, 5,6,7,8,9.,10| 


将 步 长 设置 为 比 1 大 的 数 ， 示 例如 下 : 


>>> mumber[0:10:2| 

则 

可 以 看 到 ， 对 于 number 序列 ， 设 置 步 长 为 2， 得 到 奇数 序列 。 由 此 可 见 ， 将 步 长 设置 为 大 
于 1 的 数 时 ， 会 得 到 一 个 跳 过 某 些 元 素 的 序列 。 例 如 ， 上 面 设 置 的 步 长 为 2， 得 到 的 是 从 开始 
到 结束 每 隔 1 个 元 素 的 序列 。 比 如 ， 还 可 以 这 样 使 用 : 
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>>> Tber|0:10:3|] 
[1, 4,7, 10] 

>>> nmumber[2:6:3|] 
[3. 6] 

>>> number[2:5:3| 
bj 

>>> number[ 1:5:3|] 
Bad 


除 此 之 外 ， 也 可 以 设置 前 面 两 个 索引 为 空 ， 示 例 程序 如 下 : 


>>> DuUmber|::3| 

[1. 4. 7. 10|] 

上 面 的 操作 会 将 序列 中 每 3 个 元 素 的 第 1 个 提取 出 来 ， 将 前 面 两 个 索引 都 设置 为 空 。 

再 要 注意 的 是 ， 步 长 不 能 设置 为 0。 

忆 之 ， 对 于 止 数 步 长 ，Python 会 从 序列 的 头 部 开始 同 右 提取 元 素 ， 直 到 最 后 一 个 元 素 ; 对 
于 负数 步 长 ， 则 从 序列 的 尾部 开始 同 左 提取 元 素 ， 直 到 第 一 个 元 素 。 止 数 步 长 必须 让 开始 位 置 
小 于 结束 位 置 ， 而 负数 步 长 必须 让 开始 位 置 大 于 结束 位 置 。 


3.2.3 序列 相 加 


序列 也 可 以 相 加 ， 但 要 注意 ， 这 里 的 相 加 ， 并 不 是 将 对 应 的 序列 元 素 值 相 加 ， 而 是 将 序列 
首尾 相 接 。 由 于 字符 串 属 于 字符 序列 ， 因 此 字符 串 相 加 也 可 以 看 成 序列 相 加 。 但 字符 串 不 能 和 
序列 相 加 ， 人 否则 会 抛 出 异 向 。 

以 下 程序 演示 了 两 个 序列 之 间 的 加 法 ， 以 及 序列 和 字符 串 之 则 相 加 后 会 抛 出 异 第 。 


print([1,2,3] + [6.7.8]) # 运行 结果 : [1.2.3.6.7.8] 
print("Hello"+"world")  # 运行 结果 : Hello world 


print([1,2,3] + ["hello"]) # 把 字符 串 作为 序列 的 一 个 元 素 ， 运 行 结果 : [1.2.3,"hello"] 


print([1,2.3] + [hi', 'e, 中, '0]) # 运行 结果 ，[1.2.3， 和 ve. 业 王 oq 
print[1.2.3] + "hello") # 抛 出 异常 ， 序 列 不 能 和 字符 串 直 接 相 加 


上 述 代 码 中 , 运行 最 后 一 条 语句 会 抛 出 异 第 , 原因 是 序列 和 字符 串 不 能 相 加 。 要 想 让 “hello” 
和 序列 能 够 相 加 ， 需 要 将 “hello” 作 为 序列 的 一 个 元 素 ， 如 [hello"]， 然 后 再 和 序列 相 加 。 两 个 
相 加 的 序列 元 素 的 数据 类 型 可 以 不 一 样 ， 例 如 上 述 代 码 中 ， 第 3 行将 一 个 整数 类 型 的 序列 和 一 
个 字符 串 类 型 的 序列 相 加 ， 这 两 个 序列 会 首尾 相 接 ， 从 而 连接 在 一 起 。 


3.2.4 序列 乘法 


用 数字 mn 乘 以 一 个 序列 会 生成 新 的 序列 ， 而 在 新 的 序列 中 ， 原 来 的 序列 将 被 重复 n 次。 如 
果 序 列 的 值 是 None(Python 语言 内 建 的 一 个 值 ， 表 示 “ 什 么 都 没有 ”)， 那 么 将 这 个 序列 与 数字 
n 相 乘 ， 假 设 这 个 包含 None 值 的 序列 的 长 度 是 1， 就 会 产生 占用 n 个 元 素 空间 的 序列 。 

下 面 的 示例 通过 将 字符 串 与 数字 相 乘 ,复制 学 得 串 ， 叉 通过 将 序列 与 数学 相 采 , 复制 序列 : 


>>> print(hello' * 5) # 字符 串 与 数字 相 乘 


65 上 


hellohellohellohellohello 

>>> print([20] * 10) # 序列 与 数字 相 乘 

[20, 20, 20, 20, 20, 20, 20, 20, 20, 20| 

>>> print([None] * 6) # 将 值 为 None 的 序列 和 数字 相 科 


[None., None, None, None. None. None | 


3.2.5 ”检查 某 个 元 素 是 否 是 序列 的 成 员 


检查 一 个 元 素 是 否 在 序列 中 时 用 in 运算 符 。 该 运算 符 是 布尔 运算 符 ， 返 回 结果 是 布尔 值 。 
检查 条 件 为 真 ， 返 回 True; 检查 条 件 为 假 ， 返 回 False。 示 例 程序 如 下 : 


>>2>Dame 一 Wang 

>>> WwW In name 

Trmue 

>>>'Wa' Inname 

True 

>>>'Wp' IN Name 

False 

>>>Users=["Wane'. wel'.'na'| 

>>>TaW Nput(your name:') In users 
your name:Waneg 

Tme 

>>>TaW nput(your name:") In users 
your name:cul 

False 


im 运算 符 会 检查 序列 的 成 员 ( 即 元 素 )， 而 字符 串 的 成 员 或 元 素 是 字符 ， 如 上 例 中 的 'w' in 
wang'， 早 期 版 本 中 ， 这 是 唯一 用 于 字符 串 成 员 的 检查 方法 ， 但 是 现在 可 用 in 运算 符 检 查 更 长 
的 子 字 符 串 ， 例 如 'wa' in wang'。 


3.2.6 ”计算 序列 的 长 度 、 最 大 值 和 最 小 值 


Python 提供 了 专门 的 内 建 函 数 用 于 计算 序列 的 长 度 ( 即 元 素 个 数 )、 最 大 值 ( 即 最 大 元 厅 ) 和 最 
小 值 ( 即 最 小 元 素 )， 这 些 函 数 分 别 为 : 

e len0 函 数 ， 返 回 序列 中 所 包含 元 素 的 数量 。 

e max0 函 数 ， 人 返回 序列 中 的 最 大 元 系 。 

e Imin0 鸡 数 ， 返 回 序 列 中 的 最 小 元 素 。 

示例 程序 如 下 : 

>>>mmber=[1.2.3.4.5| 

>>>len(number) 

5 

>>>max(number) 

5 

>>>min(number) 

| 
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>>>max(10.2) 
10 
>>>mm(10.2) 
2 
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Python 包含 6 种 内 建 序 列 ， 最 和 见 的 是 列表 (isb 和 元 组 (ttple)。 为 了 创建 一 个 列表 ， 只 需 
要 把 皖 号 分 隔 的 不 同 数据 项 使 用 方 括 号 括 起 来 即 可 。 例 如 : 


list] = ['Google', Runoob', 1997. 2000| 


list?2 =[1, 2, 3,4,51 
list3 一 La "DD" 2 "i 


与 字符 串 的 索引 一 样 ， 列 表 索 引 从 0 开始。 对 列表 可 以 进行 截取 、 组 合 等 。 
列表 中 的 数据 项 不 需要 具有 相同 的 类 型 。 列 表 的 内 容 是 可 变 的 ， 和 而 字符 串 和 元 组 是 不 可 变 


的 (元 组 将 在 3.4 节 中 介绍 )。 


Python 语言 为 列表 对 象 封装 了 许多 实用 的 方法 。 创 建 了 一 个 列表 对 象 之 后 ， 可 以 使 用 这 些 


方法 来 操作 该 列表 对 象 。 


前 一 章 已 经 简单 介绍 了 字符 串 变 量 ， 了 解 了 一 些 基 本 操作 。 本 下 主要 介绍 列表 对 象 的 背 讨 


方法 ， 如 表 3-3 所 示 。 


方法 
lst.append(x) 
lst.extend(L) 


lst.insert(Index.x) 
lst.remove(x) 


lst.pop([index]|) 
lst.clear() 


lst.Index(x) 


lst.count(x) 
lst.reverse() 


lst.sort(key—=None.reverse=False) 


lst.copy() 
append() 
insert() 
extend() 


表 3-3 列表 对 象 的 常用 方法 
功能 

将 元 素 x 添加 至 列表 lst 的 尾部 
将 列表 工 中 的 所 有 元 素 添加 全 列表 lst 的 尾部 
在 列表 lst 中 ， 在 指定 位 置 index 处 添加 元 素 Xx， 将 该 位 置 后 面 的 所 有 元 素 
后 移 一 个 位 置 
在 列表 lst 中 删除 首次 出 现 的 指定 元 素 ， 将 该 元 素 之 后 的 所 有 元 素 前 移 一 
个 位 置 
删除 并 返回 列表 lst 中 下 标 为 mdex( 默 认为 - 1) 的 元 素 
删除 列表 lst 中 的 所 有 元 素 ， 但 保留 列表 对 象 
返回 列表 lst 中 第 一 个 值 为 x 的 元 素 的 下 标 ， 大 不 存在 值 为 X 的 元 素 ， 则 
抛 出 寞 第 
返回 指定 元 素 X 在 列表 lst 中 出 现 的 次 数 
对 列表 lst 中 的 所 有 元 素 进 行 逆序 操作 
对 列表 lst 中 的 元 素 进行 排序 ，key 用 来 指定 排序 依据 ，reverse 决定 升序 
(Ealse) 还 是 降序 (True) 
返回 列表 lst 的 浅 复制 
用 于 向 列表 尾部 追加 一 个 元 素 
用 于 向 列表 中 的 任意 指定 位 置 插入 一 个 元 素 
用 于 将 另 一 个 列表 中 的 所 有 元 素 仍 加 至 当前 列表 的 尾部 


本 


3.3.2 ”访问 列表 元 素 


方法 


zipO 


enumerate() 


删除 列表 元 素 


用 于 删除 并 返回 指定 位 置 的 元 素 ( 默 认 是 最 后 一 个 元 率 ) 
用 于 删除 列表 中 第 一 个 元 素 值 与 指定 值 相等 的 元 素 
用 于 清空 列表 
删除 列表 中 指定 位 置 的 元 素 
用 于 返回 列表 中 指定 元 素 出 现 的 次 数 
( 续 表 ) 
功能 
用 于 返回 指定 元 素 在 列表 中 首次 出 现 的 位 置 ， 如 果 不 存 在 ， 则 抛 出 异种 
测试 列表 中 是 否 存在 茶 个 元 素 
用 于 按照 指定 的 规则 对 所 有 元 素 进行 排序 , 默认 规则 是 直接 比较 元 素 大 小 
用 于 将 列表 中 的 所 有 元 素 逆 序 排列 
用 于 返回 列表 中 所 有 元 素 的 最 大 值 和 最 小 值 
用 于 返回 数值 型 列表 中 所 有 元 率 之 和 
用 于 返回 列表 中 元 素 的 个 数 
用 于 将 多 个 列表 中 的 元 素 重 新 组 合 为 元 组 并 返回 包含 这 些 元 组 的 zip 对 象 
用 于 返回 包含 看 干 下 标 和 值 的 运 代 对 象 


当 不 需要 列表 中 的 茶 个 元 素 时 ， 可 以 使 用 del 语句 删除 列表 中 的 元 素 ， 例 如 : 


hst= [Google. ‘Runoob', 1997. 2000| 


print (" 原 始 列表 : "lisb 


del list[2] 


print ("删除 第 三 个 元 素 : ", list) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


原始 列表 : [Google', 'Runoob', 1997. 2000] 
删除 第 三 个 元 素 : [Google. Runoob'. 2000] 


注意 : 


当 为 列表 增加 或 删除 元 素 时 ， 列 表 对 象 自动 进行 内 存 的 扩展 或 收缩 ， 从 而 保证 元 素 之 间 没 
有 缝 阶 。Python 列表 的 这 项 内 存 自 动 管理 功能 可 以 大 幅 降 低 程 序 员 的 负担 ， 但 删除 和 插入 非 尾 , 
部 元 率 时 会 涉及 列表 中 大 量 元 素 的 移动 , 效率 较 低 , 并 且 对 于 某 些 操作 会 造成 意外 的 错误 结 
因此 ， 除 非 确 实 有 必要 ， 否 则 应 尽量 从 列表 尾部 进行 元 了 系 的 增加 和 删除 操作 ， 这 不 仅 可 以 大 幅 
提高 列表 的 处 理 速 度 ， 并 且 总 是 可 以 保证 得 到 正确 的 结果 。 


可 以 使 用 下 标 索 引 来 访问 列表 中 的 元 素 ， 也 可 以 使 用 方 括号 的 形式 截取 字符 ， 例 如 : 


lstl = ['Google', Runoob', 1997. 2000|: 
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hs2=ll12345671| 
print ("List1[0]: ", list1[01) 
print ("Lst2[1:3]: ", list2[1:51) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
hstl1[0|: Goople 
list2[1:$]: 12. 3.4 5| 


3.3.3 ”更 新 与 扩展 列表 


1. 更 新 列表 

可 以 对 列表 中 的 数据 项 进行 修改 或 更 新 ， 示 例如 下 : 
list = ['Google’, ‘Runoob', 1997. 2000] 

print ("第 三 个 元 素 为 :", list[2D) 

list[2] = 2001 

print ("更 新 后 的 第 三 个 元 素 为 :", list[2]) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

第 三 个 元 素 为 : 1997 

更 新 后 的 第 三 个 元 素 为 : 2001 

2. append() 方 法 

append0 方 法 用 于 在 列表 末尾 添加 新 的 对 象 ， 语 法 格式 如 下 : 
list.append(ob]) 


参数 obj 表示 要 添加 到 列表 末尾 的 对 象 。 该 方法 无 返回 值 ， 但 是 会 修改 原来 的 列表 。 示 例 
如 下 : 


lstl = ['Google', Runoob', "Taobao'| 
listl.append(' Baidu') 
print ("更 新 后 的 列表 : ", ]ist]1) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
更 新 后 的 列表 : [Google' '"Runoob', 'Taobao', 'Baidu] 
3. extend() 方 法 


extend0 方 法 用 于 在 列表 末尾 一 次 性 仍 加 另 一 个 序列 中 的 多 个 值 ( 用 新 列表 扩展 原来 的 列 
表 )， 语 法 格式 如 下 : 


list.extend(seq) 


参数 seq 表示 需要 退 加 的 元 素 列 表 。 该 方法 没有 返回 值 ， 但 会 在 已 存在 的 列表 中 添加 新 的 
列表 内 容 。 示 例如 下 : 

aList = [123, xyz', zara. 'abc', 123| 

bList = [2009, 'manni | 

aListextend(bList) 

print("Extended List : ". aList) 

执行 以 上 程序 ， 输 出 结果 如 下 : 


Extended List : [123, ‘xyz', zara abc, 123, 2009. mann | 


4. append() 和 extend() 方 法 的 区 别 


listappend(objecb 回 列表 中 添加 对 象 object; list.extend(sequence) 把 序列 seq 的 内 容 添 加 到 列 
表 中 。 示 例 程序 如 下 : 

>>> musIc media=[compact disc', '8-track tape', Jong playimgrecord | 

>>> new media= [DVD Audio dsc, 'Super Audio CD 

>>> Inuslc media.append(new media) 

>>> print(music media) 

[compact disc', '8-track tape', ‘long playmne record,, [DVD Audio disc', 'Super Audio CD'|| 
music media 对 象 中 。 

而 使 用 extend0 方 法 的 时 候 , 是 将 new media 看 作 序列 , 将 这 个 序列 和 music media 序列 合 
并 。 示 例 程序 如 下 : 

>>> Inuslc media = [compact disc', '8-track tape', long playmg record | 

>>> new_ media= [DVD Audo disc', 'Super Audio CD 

>>> music mediaextendnew media) 


>>> print(music media) 
[compact disc', '8-track tape', "Jong playme record, DVD Audio disc', 'Super Audio CD 


3.3.4 ”对 列表 元 素 进行 统计 

为 了 对 列表 中 元 素 出 现 的 次 数 进行 统计 ， 可 以 使 用 count0 方 法 。count0 方 法 用 于 统计 某 个 
元 系 在 列表 中 出 现 的 次 数 ， 语 法 格式 如 下 : 

list.count(ob]) 

其 中 ， 参 数 obj 表示 列表 中 要 统计 的 对 象 。count0 方 法 的 返回 值 是 元 素 在 列表 中 出 现 的 次 
数 。 示 例 程序 如 下 : 


>>> aList=[123, xyz', zara', 'abc’, 123|]: 
>>> print("Count for 123: ",aList.count(123)) 
Count for 123: 2 
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>>> print("Count for zara: ",aListcount(zara ) ) 
Count for zara: 1 


3.3.5 ”对 列表 进行 排序 


内 置 方 法 sort0 用 来 对 列表 元 素 进行 排序 ， 也 可 以 使 用 内 置 的 全 局 方法 sortedO 来 对 可 过 代 
的 序列 排序 以 生成 新 的 序列 。 


1. 排序 基础 


简单 的 升序 排序 是 非 第 容易 实现 的 。 只 需要 调用 sorted0 方 法 。 它 返回 一 个 新 的 列表 ， 新 的 
列表 基于 小 于 运算 符 (_1t _) 来 排序 。 例 如 : 


>>> sorted([5, 2. 3, 1. 4]) 
[22349 


也 可 以 使 用 list.sort0 方 法 来 排序 ， 此 时 列表 本 刁 将 被 修改 。 通 第 此 方法 不 如 sorted0 方 便 ， 
但 是 如 果 不 需 要 保留 原来 的 列表 ， 此 方法 将 更 有 效 。 例 如 : 


>>> a=[5., 2,3, 1,4] 
>>> q.sort() 

>>>a 

[1, 2, 3, 4. 5 


男 一 个 不 同 之 处 就 是 : list.sort0 方 法 仅 被 定义 在 列表 中 ， 相 有 反 ，sorted0 方 法 对 所 有 的 可 连 
代 序 列 都 有 效 。 例 如 : 


>>> sarted({1: TD 2: 了 3: B', 4: E, 5:'A'}) 
[2343| 


2. key 参数 /函数 


从 Python 2.4 开始 ， 为 list.sortO 和 sorted0 方 法 增加 了 key 参数 来 指定 一 个 函数 ， 此 函数 将 
在 比较 每 个 元 素 前 被 调用 。 例 如 ， 通 过 key 指定 的 函数 来 忽略 字符 串 的 大 小 写 : 


>>> sorted("This 1s a test strng from Andrew".sphtO)., key=str.lower) 
[a ‘Andrew', from' 1s', 'string’, test， "This'| 


key 参数 的 值 为 一 个 函数 ， 此 函数 只 有 一 个 参数 日 返回 一 个 值 用 来 进行 比较 。key 参数 指定 
的 函数 将 准确 地 对 每 个 元 素 进行 调用 。 
更 广泛 的 使 用 情况 是 用 复杂 对 象 的 某 些 值 来 对 复杂 对 象 的 序列 进行 排序 ， 例 如 : 


>>> student tuples=|[ 
(Jobn', 'A', 15), 
(Jane', 'B', 12), 
(dave', 'B', 10). 
| 
>>> sorted(student tuples. key=lambda student: student[2]) ”# 安 照 age 字段 排序 


[(dave'. 'B', 10). (Jane', 'B', 12). (Johbn', 'A', 15)| 


3. 升序 和 降序 


listsortO0 和 sorted0 方 法 都 接收 一 个 参数 reverse( 值 为 True 或 False) 来 表示 升序 或 降序 排序 。 
例如 : 

>>> test= [6,1.2,3.,4,5] 

>>>8= sorted(test.reverse=True) 

>>> print(a) 

[6, 5, 4, 3, 2, 1] 


3.3.6 ”列表 推导 式 


1. 基本 列表 推导 式 

列表 推导 式 提 供 了 一 种 创建 列表 的 简便 方法 。 创建 列表 时 , 列表 中 的 元 素来 源 于 其 他 序列 、 
可 友 代 对 象 或 创建 的 一 个 满足 某 条 件 的 序列 。 

假设 要 创建 一 个 平方 数组 成 的 列表 ， 比 如 : 


squares 二 | 
for x mrange(10): 


squares.append(x™**2) 
prnt(squares) 


输出 结果 如 下 : 

[0, 1, 4. 9. 16, 25, 36, 49. 64, 81| 

也 可 以 通过 下 面 的 方式 获得 相同 的 列表 : 

squares = [x**2 for x in range(10)] 

这 也 等 价 于 下 面 的 方式 ， 但 使 用 列表 推导 式 更 简单 。 
squar = map(lambda x:x**2.range(10)) 


函数 map(functioniterable) 含 有 两 个 参数 ， 第 一 个 参数 function 是 一 个 函数 ， 第 二 个 参数 
iterable 是 一 个 列表 。 为 列表 中 的 每 一 个 元 素 调 用 函数 function, 调用 结果 将 构成 一 个 新 的 序列 。 

列表 推导 式 包 含 一 对 方 括号 ， 在 方 括号 中 有 一 个 表达 式 ， 表 达 式 后 面 紧 跟 一 条 for 语句 ， 
然后 是 零 条 或 多 条 的 for 语句 或 站 语句 。 通过 for 语句 和 站 语句 计算 出 表达 式 , 将 结果 作为 新 列 
表 的 元 素 。 语 法 格式 如 下 : 


[表达 式 for 变量 in 序列 或 迭代 对 象 ] 


列表 推导 式 是 Python 最 受 欢 迎 的 特性 之 一 ， 掌 握 它 是 成 为 合格 Python 程序 员 的 基本 标准 。 
本 质 上 ， 可 以 把 列表 推导 式 理 解 成 一 种 集合 了 变换 和 筛选 功能 的 图 数 ， 可 通过 这 种 函数 把 一 个 
列表 转换 成 另 一 个 列表 。 注 意 是 另 一 个 新 列表 ， 原 始 列 表 保 持 不 变 。 
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例如 ， 下 面 的 列表 推导 式 将 两 个 不 同 列表 中 的 元 系 整 合 到 了 一 起 : 


>>> [(x.y)for x m|1,2,3| fory ml[3,1.4| fx (=y] 
[(1., 3). (1. 4), (2, 3), (2, 站 2, 4), 3. 1 (3 4)| 


这 等 价 于 : 


>>> combs = |] 
>>> for x m [1,2,3|: 
for y m [3.1.4|: 
i x (一 Y: 
combs.append((x.y)) 


>>> combs 


[3).0, 人 3) D6, D8, 


注意 ，for 语句 和 于 语句 在 这 两 段 程序 中 的 顺序 是 相同 的 。 
如 果 表 达 式 是 一 个 元 组 (例如 前 面 例子 中 的 (x,y))， 那 么 必须 给 它 加 上 辆 括号 。 


>>> vec=| -4, -2.0.2.4| 

>>> #{ 吏 用 vec 中 元 素 的 倍数 ， 创 建 一 个 数组 
>>> [xX*2 for x in vec]| 

[| -8 -4048| 

>>> #j 过 滤 列 表 ， 删 除 列 表 中 的 负数 

>>> [x forx mvecifx>=0| 

[0, 2.4] 

>>> # 对 列表 中 的 每 个 元 素 应 用 一 个 函数 

>>> |abs(X) for x m vec| 

[4. 2, 0, 2. 4] 

>>> # 对 每 个 元 素 调 用 一 个 方法 

>>> freshfruit = ['000banana00''0000loganberry0','OQpassion fruit00000"] 
>>> [weapon. strip('0") for weapon in freshfruit]#str.strip(ch) : 删除 字符 串 开头 及 结尾 处 的 字符 ch 
[banana'. loganberry'. passlon frut | 

>>> # 创 建 一 个 2 元 元 组 ， 比 如 (number, square) 
>>> [(xX.x**2) for x in range(6)] 

[0. 0), (1, D, (2, 4), (3, 9). (4, 16), (5, 25)] 

>>> #7C 组 必须 用 圆 括号 包围 ， 不 然 就 会 出 错 
>>> [xX,x**2 for x in range(6)]| 

SyntaxEiror: InValld syntax 

>>> # 尾 一 个 多 维 数组 转换 为 一 维 数组 

>>> Vec 三 [1.2.3].14.5.6|.17.8.9]] 

>>> [num forelem in vec for num in elem| 

[1, 2, 3, 4, 5, 6, 7, 8, 9] 


列表 推导 去 可 以 包含 复杂 表达 式 和 藤 套 函数 ， 例 如 : 


>>> from math import pi 
>>> [strtoundpiD) foriin range(1.6)] 


13.1 "3.14,3.142 3.141 人 ,3.141539 | 
对 于 round0 函 数 ， 其 执行 与 Python 版 本 和 计算 机 的 精度 有 关 。 
2. 藤 套 的 列表 推导 式 


列表 推导 式 中 ， 最 基本 的 表达 式 可 以 是 任意 表达 式 ， 包 括 其 他 列表 推导 式 。 
下 面 的 3*4 矩阵 可 以 当 作 一 个 列表 ， 该 列表 由 3 个 长 度 为 4 的 子 列表 组 成 : 


>>> matrx = | 
[1,2.,3,4], 
[3,6,7,8], 
.10.11.12| 
] 
>>PInatrX 
[L234,15.6 7 801011, 12 中 


使 用 下 面 的 列表 推导 式 转 置 行 和 列 : 


>>> [[row list[]| for row lstimmatnxjtorlmrange(d)| 
[[1, 5, 9], [2. 6, 10], [3, 7, 11], [4, 8, 12]] 


从 前 面 的 内 容 中 可 以 看 出 ， 髓 套 的 列表 推导 式 是 在 for 循 坏 的 循环 体 中 进行 计算 的 ， 所 以 


上 面 的 例子 等 同 于 : 


>>> transposed= [| 

>>> lorlimnranpe(4): 
transposed.append([rowl]| for row in matrix|) 

>>> transposed 

L326 10),B 7 1 4% 12 


也 等 同 于 ; 


>>> transposed 
[[1, $, ?1. [2, 6, 10], [3, 7, 1 [4 8. 12]] 
>>> transposed = [| 
>>> for ] In ranee(4): 
# 下 面 的 三 行 实现 了 嵌 套 的 列表 推导 式 
transposed row = [| 
tor row list In matrix: 
transposed row.append(row list[]|) 
transposed.append(transposed row) 


>>> transposed 
[[1, $, 9], [2, 6, 10], [3, 7, 11], [4, 8. 12]] 


在 现实 情况 中 , 与 复杂 的 流 式 语句 相 比 , 有 的 程序 员 可 能 更 喜欢 Python 的 内 置 函 数 。 由 此 ， 


zip0 函 数 更 适合 完成 上 面 的 工作 。 
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>>> zipp = zip(*matrix) 
>>> list(Zipp) 
[OA EA 


ER 元 组 


对 于 一 些 不 想 让 修改 的 数据 ， 可 以 用 元 组 (Tuple) 来 保存 。 元 组 被 称 为 只 读 列表 ， 数 据 可 被 
伍 询 ， 但 不 能 被 修改 ， 类 似 于 列表 的 切片 操作 ， 元 组 写 在 圆 括号 里 面 ， 元 素 之 间 用 逗号 隐 开 。 


3.4.1 元 组 的 创建 
元 组 的 创建 很 简单 ， 只 需要 在 圆 括号 中 添加 元 素 ， 并 使 用 逗号 隔 开 即 可 ， 示 例如 下 : 


>>>tupl = (Google', Runoob', 1997. 2000): 

>>> tup2={], 2, 3, 4, 5 ). 

>>> tup3="a", "bn "er "d"。 天 没有 圆 括号 也 可 以 
>>> type(tup3) 

<class tple> 


下 面 创建 一 个 至 的 元 组 ， 示 例如 下 : 


# 创建 一 个 空 的 元 组 

tup=() 

prnt(tup) 

print(type(tup))# 使 用 type 函数 查看 类 型 
# 输 出 结果 


0 
<class 'tuple> 


元 组 中 只 包含 一 个 元 素 时 ， 需 要 在 这 个 元 素 的 后 面 添加 逗号 ， 否 则 圆 括号 会 被 当 作 运算 符 
使 用 : 

# 创建 元 组 (只 有 一 个 元 素 时 ， 在 这 个 元 素 的 后 面 加 上 侠 号 ) 

tp=(1.) # 元 组 中 只 有 一 个 元 素 时 ， 在 这 个 元 素 的 后 面 加 上 逗号 ， 否 则 会 被 当成 其 他 数据 类 型 处 理 

print(tup) 

print(type(tup))# 使 用 type 函数 查看 类 型 

# 输 出 结果 


(1,) 
<class "tuple> 


元 组 的 元 素 可 以 是 不 同 的 数据 类 型 ， 示 例如 下 : 


tmp 三 (12. ab "ca 
print(tup) 
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执行 以 上 程序 ， 输 出 结果 如 下 : 
《1 过 Ta, Bb. cl,'a) 


述 可 以 将 列表 转换 为 元 组 ， 示 例如 下 : 


list name = ["python book","Mac","bile","kindle"| 

tup 二 tuple(list name) 并 将 列表 转换 为 元 组 

print(type(list name)) # 查看 list_name 的 类 型 ， 并 将 结果 打印 出 来 
prnt(type(tup)) # 查看 tup 的 类 型 ， 并 将 结果 打印 出 来 


print(tup) 

执行 以 上 程序 ， 输 出 结果 如 下 : 
<class ist 

<class 'tuple> 


(‘python book', "Mac', ‘bile', ‘kindle') 

元 组 与 字符 串 类 似 ， 下 标 索 引 从 0 开始 ， 可 以 执行 截取 、 组 合 等 操作 。 
3.4.2 ”访问 元 组 元 素 

可 以 使 用 下 标 索 引 来 访问 元 组 中 的 元 素 ， 示 例如 下 : 


tupl = (Google', Runoob'. 1997. 2000) 
tup2=(1, 2, 3, 4, 5, 6,7) 
print("tup1[0]: ", tup1[0)) 
print("tap2[1:5]: ", tup2[1:5]) 


执行 程序 ， 输 出 结果 如 下 : 
tupl1[0]: Gooele 
tup2[1:5]: (2. 3. 4. 5) 
34.3 连接 元 组 
元 组 中 的 元 素 是 不 允许 修改 的 ， 但 可 以 对 元 组 进行 连接 ， 示 例如 下 : 


tupl = (12, 34.30): 

tup2 = (abc', ‘xyz) 

# 修改 元 组 元 素 的 操作 是 非法 的 
# tupl[0|= 100 

# 创建 一 个 新 的 元 组 

tup3 = tupl + tup2: 

print(tup3) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


(12. 34.56, 'abe', xyz') 
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3.4.4 ”删除 元 组 
元 组 中 的 元 素 是 不 允许 删除 的 ， 但 可 以 使 用 del 语句 来 删除 整个 元 组 ， 示 例如 下 : 


tup = (Google', Runoob', 1997, 2000) 
prnt(tup) 

del tup; 

print(" 删 除 后 的 元 组 tup; ") 
print(tup) 


以 上 元 组 被 删除 后 ， 输 出 变量 时 会 有 异常 信息 ， 输 出 结果 如 下 : 
删除 后 的 元 组 tup: 


Traceback (most Tecent call last): 
File “test.py", line 8. Im <module> 
print (tup) 
NameE1ror: name 'tup' 1s not defined 


由 于 元 组 是 不 可 变 类 型 ， 因 此 ， 元 组 不 支持 列表 中 针对 元 素 的 增 、 删 、 改 操作 ， 只 支持 查 
询 操 作 。 
3.4.5 ”元 组 的 运算 符 

与 字符 串 一 样 ， 元 组 之 间 可 以 使 用 + 号 和 * 号 进行 运算 ， 如 表 3-4 所 示 。 这 就 意味 着 元 组 可 
以 组 合 和 复制 ， 运 算 后 会 生成 一 个 新 的 元 组 。 


表达 式 描述 


len((]1, 2, 3)) 计算 元 素 个 数 
1.2 3)+ (4, 5.6 连接 

Hil,) * 4 复制 

3in(1.2.3 判断 元 素 是 否 存在 


for x in (1. 2. 3): print(x) 连 代 
另外 ， 因 为 元 组 也 是 序列 ， 所 以 可 以 访问 元 组 中 指定 位 置 的 元 素 ， 也 可 以 截取 索引 中 的 一 
段 元 素 ， 示 例如 下 : 


>>>L = (Google'. 'Taobao', Runoob’) 
>>>L[2] # 读 取 第 三 个 元 素 


'Runoob 

>>>L[-2] ”# 反 同 读 取 ; 读 取 倒数 第 二 个 元 素 
"Taobao’ 

>>>L[1:]  # 截 取 元 素 ， 从 第 二 个 开始 后 的 所 有 元 素 
(Taobao', Runoob') 


3.4.6 ”生成 颖 


虽然 可 以 用 列表 存储 数据 ， 但 是 当 数 据 量 特别 大 的 时 候 ， 建 立 一 个 列表 来 存储 数据 就 会 十 
分 占用 内 存 。 这 时 生成 器 就 派 上 用 场 了 。 这 是 一 种 不 怎么 占用 计算 机 资源 的 方法 。 

前 面 介 绍 列表 的 时 候 ， 介 绍 了 如 何 用 列表 推导 式 来 初始 化 列表 ， 例 如 : 

list$ = [x for x in range($)| 

print(ist$) 。 # 输 出 : [0, 1, 2, 3. 4] 

元 组 没有 推导 式 ， 但 是 可 以 使 用 类 似 的 方式 来 生成 一 个 生成 器 ， 只 不 过 需要 将 上 面 的 [ ] 换 
成 ()， 例 如 : 

gen 三 (torxXInranpge(S)) 

prnt(gen) 

# 输 出 : ”<generator object <genexpr> at 0x0000000000AA20F8> 

从 输出 结果 可 以 看 出 ,生成 器 并 不 是 直接 输出 结果 ， 而 是 告诉 我 们 这 是 一 个 生成 器 。 那 么 ， 
需要 怎么 调用 这 个 gen 生成 器 呢 ? 

有 两 种 方式 ， 第 一 种 调用 方式 如 下 : 

for lteml Imn gen: 

print(item) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


> 


第 二 种 调用 方式 如 下 : 

printnext(gen) 岩 输出 :0 

print(next(gen) 岩 输出 :1 

printnext(gen) 关 输出 :2 

print(next(gen) 央 # 输出 :3 

print(next(gen) 关 输出 :4 

print(next(gen) 岩 输出 :Traceback(most recent call lasb:StopIteration 

下 面 介绍 一 下 生成 器 的 原理 。 从 第 一 种 调用 方式 可 以 知道 ， 生 成 器 是 可 兴 代 的 , 确切 地 说 ， 
生成 器 就 是 迭代 器 。 验 证 代码 如 下 : 

from collections Import Iterable, Iterator 

print(isinstance(gen, Iterable))# 输 出 :Tme 

print(isinstance(gen, IteratoD))j# 输 出 :True 

字符 串 、 列 表 、 元 组 、 字 典 、 集 合 都 是 可 迭代 的 ， 可 以 使 用 for 循环 来 访问 里 面 的 每 一 个 
元 素 。 但 它们 并 不 是 迭代 复 。 
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假如 定义 一 个 泡 茶 函数 (迭代 器 )， 然 后 将 泡 茶 的 方法 封装 进 这 个 孙 数 。 每 一 次 调用 这 个 函 
数 就 返回 一 个 步 怠 ， 并 保存 好 当前 执行 到 哪个 状态 。 如 果 中 途 有 事 ， 比 如 执行 到 步 又 二 的 时 候 
突然 去 接 了 个 电话 ， 回 来 调用 这 个 函数 就 会 得 到 步骤 三 (水 升 了， 开始 泡 茶 )， 也 就 是 状态 保存 
好 了 。 可 以 执行 这 个 泡 茶 函数 ， 直 到 调用 完 所 有 步 又 为 止 。 

定义 一 个 函数 ， 这 个 函数 是 一 步 步 执行 的 ， 并 能 保存 状态 ， 这 就 是 达 代 器 。 

到 上面 的 第 二 种 调用 方式 , 到 第 6 个 printmext(gen)) 时 , 系统 告知 Traceback(most recent call 
last): StopIteration。 也 就 是 说 ，gen 友 代 到 最 后 了 ， 无 法 继续 迭 代 。 

生成 占 本 和 号 就 是 达 代 器 ， 在 内 部 封装 好 了 算法 ， 并 规定 好 在 某 个 条 件 下 就 返回 一 个 结果 给 
调用 者 。G for x in range(9)) 就 是 这 样 实现 的 ， 并 不 是 先 实现 (0, 1, 2, 3, 4 人， 再 一 个 个 迭代 出 来 ， 
而 是 逐个 生成 。 


3.4.7 ”元 组 与 列表 的 区 别 


元 组 和 列表 类 似 ， 都 是 线性 表 。 唯 一 不 同 的 是 ， 元 组 中 存储 的 数据 不 能 被 程序 修改 ， 可 以 
将 元 组 看 作 只 能 读 取 数据 而 不 能 修改 数据 的 列表 。 因 为 元 组 和 列表 有 很 多 相同 之 处 ， 关 于 列表 
讲 过 的 内 容 ， 此 处 不 再 重复 讲述 ， 重 点 讲述 元 组 和 列表 的 不 同 之 处 ， 然 后 讨论 元 组 数据 的 不 可 
修改 特性 。 
e 声明 元 组 并 赋值 的 语法 与 列表 相同 ， 不 同 之 处 是 : 元 组 使 用 圆 括号 ， 列 表 使 用 方 括号 。 
元 素 之 间 都 用 英文 逗号 分 隔 。 
e 元 组 的 访问 和 列表 相同 ， 可 以 直接 使 用 下 标 索 引 访 问 元 组 中 的 单个 数据 项 ， 也 可 以 使 
用 截取 运算 符 访问 子 元 组 。 访 问 运 算 符 包 括 “[]” 和 “[:]” 运 算 符 ， 用 于 访问 元 组 中 的 
单个 数据 项 或 子 元 组 。 
e 元 组 是 不 可 修改 类 型 ， 虽 然 在 程序 运行 过 程 中 无 法 对 元 组 的 元 素 进行 插入 和 删除 运算 ， 
但 元 组 可 以 通过 构造 一 个 新 的 元 组 并 蔡 换 旧 的 元 组 ， 实 现 元 素 的 插入 和 删除 。 
e 可 以 把 多 个 元 组 合并 成 一 个 元 组 ， 合 并 后 的 元 组 中 ， 元 素 顺序 保持 不 变 。 合 并 后 的 元 
组 为 新 的 元 组 ， 原 有 的 元 组 保持 不 变 。 
e 元 组 的 遍历 方式 和 列表 相同 ， 都 是 使 用 for 循环 语句 进行 遍历 。 
e 和 列表 一 样 ， 适 用 于 列表 的 方法 也 同样 适用 于 元 组 。 但 由 于 元 组 的 不 可 修改 特性 ， 用 
于 列表 的 排序 、 蔡 换 、 添 加 等 方法 ， 在 元 组 中 不 能 使 用 。 可 以 使 用 的 主要 方法 有 : 计 
算 元 组 个 数 、 求 元 组 中 的 最 大 值 、 求 元 组 中 的 最 小 值 等 。 
e 元 组 的 不 可 修改 特性 可 能 会 让 元 组 变 得 非常 不 灵活 ， 因 为 元 组 作为 容器 对 象 ， 很 多 时 
候 需 要 对 容器 中 的 元 素 进行 修改 ， 这 在 元 组 中 是 不 允许 的 。 元 组 可 以 说 是 列表 的 一 种 
补充 。 


ER 字典 


字典 (dictionary) 是 另 一 种 可 变 容器 模型 ， 并 且 可 存储 任意 类 型 对 象 ， 如 字符 串 、 数 字 、 元 
组 等 其 他 容器 模型。 
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3.5.1 字典 的 创建 
字典 由 键 和 对 应 值 成 对 组 成 。 字 典 也 被 称 作 关联 数组 或 哈 希 表 。 基 本 语法 如 下 : 
dict= {ALlce': 2341 Beth: '9102 Cecl '3258" 


也 可 以 使 用 以 下 方式 创建 字典 : 


dictl = frabc': 456 } 
dict2 = frabc': 123. 98.6: 37 } 


需要 注意 的 是 ， 键 与 值 用 冒号 隔 开 (:)， 每 对 键 与 值 用 逗号 分 隔 ， 整 体 放 在 花 括号 中 ({)。 
键 必须 独一无二 ， 但 值 则 不 必 ， 既 可 以 是 标准 对 象 ， 也 可 以 是 用 户 自 定义 对 象 。 值 可 以 取 任 何 
数据 类 型 ， 但 必须 是 不 可 变 类 型 ， 如 字符 串 、 数 或 元 组 。 键 必须 不 可 变 ， 所 以 可 以 用 数字 、 字 
符 串 或 元 组 充当 ， 而 用 列表 就 不 行 。 
3.5.2 ”访问 字典 

创建 字典 后 ， 要 访问 字典 中 的 元 素 ， 可 以 把 相应 的 键 放 入 方 括号 ， 示 例如 下 : 


dict= {Name': ‘Zara', Age': 7, Class: First'} 
print(“dict[ Name'l: ", dict[Name'|) 
print("dictl Age'l: ", dict[' Age'l) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


dict[Name'|l: Zara 
dict['Age'|: 7 


如 果 用 字典 里 没有 的 键 访问 数据 ， 会 输出 错误 ， 示 例如 下 : 


dict= {Name': ‘Zara', 'Age': 7, 'Class': 'First'} 
print("dict[ Alicel: ", dict[ Alice'|) 


执行 以 上 程序 将 输出 如 下 错误 : 


#EKeyError: 'Alice'[/code| 


3.5.3 ”修改 字典 
向 字典 添加 新 内 容 的 方法 是 增加 新 的 键 / 值 对 ， 也 可 修改 或 删除 已 有 键 / 值 对 ， 示 例如 下 : 
dict= {Name': ‘Zara', Age': 7, Class: First'} 
dict['Age]=8 # 修改 元 素 
dictSchool] = "DPS School" # 增加 元 素 
print("dictf Age']: ", dict['Age]) 
print(“dict['Schooll: ". dict[' School'l) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
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dict['Age']: 8 
dict['School'|: DPS School 


3.5.4 ”删除 字典 元 素 
对 于 字典 ， 可 以 删除 字典 中 的 草 个 元 素 ， 也 可 以 清空 字典 ， 或 者 删除 整个 字典 ， 示 例如 下 : 


dict= {Name': Alice. 'Age': 7. Class: TITSt} 


del dict[Name'] # 删除 键 Name' 
dictclear0) # 清空 字典 
del dict # 删除 字典 


print("dict[ Age'l: ", dict[' Age'|) 
print("dict['Schooll]: ". dict[' School’]) 


执行 以 上 程序 会 引发 异 币 ， 因 为 执行 del 操作 后 字典 不 再 存在 : 


Traceback(most recent call last): 
File "demo.py" lme 9. m <module> 
print("dict[ Age'l: ", dict['Age'|) 
TypeEIror 'type' object 1s not subscriptable 


3.5.5 ”字典 的 内 置 方法 
现在 总 结 一 下 Python 字典 对 象 包含 的 内 置 方法 ， 如 表 3-5 所 示 。 


表 3-5 字典 的 内 置 方法 


方法 功能 

pfdictl. dict?) 比较 两 个 字典 元 素 
len(dict) 计算 字典 元 素 的 个 数 ， 即 键 的 总 数 
str(dict) 输出 字典 可 打印 的 字符 串 表 示 形 式 
ype(variable) 返回 得 入 的 变量 类 型 ， 如 果 变 量 是 字典 ， 就 返回 字典 类 型 
dictclear0) 删除 字典 内 所 有 元 素 
dict.copyO 返回 字典 的 浅 复 制 
dict.fromkeys(seq[.vall) 创建 一 个 新 字典 ， 以 序列 seq 中 的 元 素 作 为 字典 的 键 ，val 为 字典 所 有 


dict.set(key, default—=None) 


键 对 应 的 初始 值 
返回 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 default 值 


dict.has key(key) 如 果 键 在 字典 中 ， 返 回 True， 否 则 返回 False 
dict.items() 以 列表 形式 返回 可 遍历 的 ( 键 . 值 ) 元 组 数组 
dictkeys0) 以 列表 形式 返回 一 个 字典 中 所 有 的 键 


dict.setdefault(key. default=None) 


dict.update(dict2 
dict.values() 


和 get0 类 似 ， 但 如 果 键 已 经 存在 于 字典 中 ， 将 会 添加 键 并 将 值 设 为 
default 

把 字典 dict 的 键 / 值 对 更 新 到 dict 中 

以 列表 形式 返回 字典 中 的 所 有 值 


3.5.6 ”字典 的 遍历 


字典 是 一 种 经 常 使 用 且 应 用 广泛 的 数据 结构 ， 主 要 用 于 存储 键 值 对 形式 的 数据 。 实 际 编程 
实践 中 ， 经 常 需要 对 字典 元 系 进行 表 历 ， 包 括 所 历 字 典 的 键 、 值 、 项 以 及 键 值 对 。 


1. 南 历 字典 的 键 
当 需 要 遍历 字典 d 的 键 时 ， 使 用 for key in d 的 形式 进行 遍历 ， 示 例如 下 : 


>>> d={Lst:[1, 2, 3],1:123,111":'python3",tuple':(4., $, 6)} 
>>> for key m d: 
print(str(key)+".'+str(d[key))) 
list:[1, 2, 3] 
1:123 
111:python3 
tuple:(4. 5. 6) 


义 如 : 


>>> d={Lst:[l1., 2, 3],1:123,111":'python3".tuple':(4., 5, 6)} 
>>> for key m dkeys(): 
print(key) 
1 
lst 
111 
Tuple 


2. 遍历 字典 的 值 
当 需 要 遍历 字典 d 的 值 时 ， 使 用 for value in d.value0 的 形式 进行 遍历 ， 示 例如 下 : 


>>> d={List:[1, 2, 3],1:123,111":python3",tuple':(4, $, 6)} 
>>> for value m d.values(): 
print (value) 
| 
123 


python3 
(4.5.0) 


3. 人 遍历 字典 的 项 
要 遍历 字段 的 项 并 逐 项 输出 ， 可 以 使 用 for item in d.items0 的 形式 实现 ， 示 例如 下 : 


>>> d={List:[1, 2, 3|.1:123.1112:python3' .tuple':(4. 9. 6)} 
>>> for item in d items(}: 
print(item) 
(list, [1, 2, 3D 
(1, 123) 
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(C111. 'python3") 
Ctuple', (4. 3, 6)) 


4. 遍历 字典 的 键 值 对 


除了 以 上 通 历 方式 外 ， 还 可 以 按照 键 值 对 形式 轴 历 字典 对 象 ， 示 例如 下 : 


>>> d={Lst:[1, 2, 3|.1:123.1112:python3' .tuple':(4. 4. 6)} 
>>> for key.value im d.items(): 
print(key.value) 
List [1, 2, 3] 
1 123 
111 python3 
tuple (4. $5. 6) 


ER 集合 


3.6.1 集合 的 创建 


集合 (SeD) 是 一 种 无 序 的 不 和 章 复元 系 序列 。 可 以 使 用 花 括 号 { } 或 set0 函 数 创 建 集合 ， 注 意 ， 


创建 一 个 空 集合 时 必须 使 用 set0 而 不 是 { }， 因 为 { } 用 来 创建 一 个 空 字典 。 
创建 集合 对 象 的 语法 格式 如 下 : 


parame = {value01.value02.,...} 
或 者 

set(value) 

示例 如 下 : 


>>>basket = {apple', "oranege', 'apple', 'pear’, 'orange', banana'} 
>>> print(basket) # 这 里 演示 的 是 去 重 功能 
{'orange', ‘banana', pear，apple} 

>>> 'orange' in basket # 快速 判断 元 素 是 否 在 集合 内 
True 

>>> 'craberass' in basket 

False 

>>># 下 面 展 示 两 个 集合 间 的 运算 


>>> a= set(‘abracadabra'") 

>>> b= set(alacazam') 

>>>a 

fa Tb cd)} 

>>>a-b # 集合 a 中 包含 而 集合 b 中 不 包含 的 元 素 
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fr ,DD 

>>>alb  # 集合 a 或 b 中 包含 的 所 有 元 素 
fm 

>>>a 改 b # 和 集合 a 和 b 中 都 包含 的 元 素 
La 

>>>a^b ” # 不 同时 包含 于 a 和 hb 的 元 素 
如 


类 似 于 列表 推导 式 ， 同 样 ， 集 合 也 文 持 集合 推导 式 ， 丰 例如 下 : 


>>>a= {xX for x m ‘abracadabra' 1{ x not m ‘abc'} 
>>>a 
{Yr, 下 d} 


3.6.2 ”集合 的 常用 操作 


1. 头 加 元 素 

要 问 集合 中 添加 一 个 元 素 ， 语 法 格式 如 下 : 

s.add(x) 

将 元 系 x 添加 到 集合 s 中 时 ， 如 果 元 系 x 已 存在 ， 则 不 进行 任何 操作 。 例 如 : 


>>>thisset = set(("Google", "Runoob", "Taobao")) 
>>> thisset.add("Facebook") 

>>> print(thisset) 

{Taobao', 'Facebook', 'Google', Runoob'} 


还 有 一 种 方法 ， 也 可 以 用 来 添加 元 素 ， 且 参数 可 以 是 列表 、 元 组 、 字 典 等 ,语法 格式 如 下 : 
s.update(x) 
xX 可 以 有 多 个 ， 用 逗号 分 开 。 例 如 : 


>>>thisset = set(("Google", "Runoob". "Taobao")) 
>>> thisset.update({1,3}) 

>>> print(thisset) 

{1, 3, 'Google', "Taobao', Runoob’'} 

>>> thissetupdate([1.4].1S.6]) 

>>> print(thisset) 

{1. 3. 4. 5. 6. 'Gooegle', ‘Taobao'. Runoob'} 

2 


2. 移 除 元 素 
要 从 集合 中 移 除 一 个 元 素 ， 语 法 格式 如 下 : 


s.Iemove( X ) 
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将 元 素 X 从 集合 s 中 移 除 时 ， 如 果 元 素 x 不 存在 ， 则 会 发 生 错 误 。 例 如 : 


>>>thisset = set(("Gooegle". "Runoob", "Taobao")) 

>>> thisset.remove("Taobao") 

>>> print(thisset) 

{Google', ‘Runoob'} 

>>> thisset. remove("Facebook") # 不 存在 则 会 发 生 错 误 
Traceback (most recent call last): 

File "<stdm>", lne 1. In <module> 

KeyE1ror: Facebook' 


此 外 还 有 一 种 方法 ， 也 可 以 用 于 移 除 集合 中 的 元 素 ， 且 如 果 元 素 不 存在 ， 不 会 发 生 错误 。 
语法 格式 如 下 所 示 : 


s.discard(x) 
示例 如 下 : 


>>>thisset = set(("Google", "Runoob", "Taobao")) 

>>> thisset.discard("Facebook") ”# 不 存在 则 不 会 发 生 错 误 
>>> prmt(thisset) 

{Taobao', 'Gooele', Runoob } 


也 可 以 随机 删除 集合 中 的 一 个 元 素 ， 语 法 格式 如 下 : 
spopU 
示例 如 下 : 


thisset = set(("Google", "Runoob". "Taobao", "Facebook )) 
x = thisset.popO) 

prnt(x) 

前 出 结 朱 如 下 + 


$ python3 test.py 
Runoob 


多 次 执行 时 ， 测 试 结果 都 不 一 样 。 

然而 在 交互 模式 下 ,pop0 方 法 则 用 于 删除 集合 中 的 第 一 个 元 系 (排序 后 的 集合 中 的 第 一 个 元 
素 )。 

>>>thisset = set(("Google", "Runoob", "Taobao", "Facebook")) 

>>> thisset.pop() 

'Facebook 

>>> print(thisset) 

{Google'. 'Taobao', ‘Runoob’} 


3. 计算 集合 中 元 素 的 个 数 
Python 提供 了 内 首 的 len0 方 法 以 计算 集合 中 包含 的 元 素 的 个 数 。 语 法 格式 如 下 : 
len(s) 


执行 后 将 返回 集合 s 中 元 系 的 个 数 。 示 例如 下 : 


>>>thisset = set(("Google", "Runoob", "Taobao")) 

>>> len(thisset) 

3 

4. 清空 集合 

当 不 需要 和 集合 时 ， 可 以 使 用 clear0 方 法 清空 集合 。 语 法 格式 如 下 : 
s.clear() 

以 清空 集合 s 为 例 : 


>>>thisset = set(("Google". "Runoob". "Taobao")) 

>>> thisset.clear() 

>>> print(thisset) 

set() 

5. 判断 元 素 是 否 在 集合 中 

各 集合 中 的 元 素 过 多 ， 怎 么 找到 指定 的 元 素 呢 ? Python 提供 了 专门 的 方法 用 于 判断 元 素 是 
否 在 集合 中 。 语 法 格式 如 下 : 

XINS 

该 语句 判断 元 素 X 是否 在 集合 s 中 ， 存 在 则 返回 Tme， 不 存在 则 返回 False。 示 例如 下 : 

>>>thisset = set(("Google". "Runoob", "Taobao")) 

>>> "Runoob" in thisset 

True 


>>> "Facebook" m thisset 
False 


3.6.3 ”集合 的 内 置 方法 
Python 为 集合 对 象 提供 了 一 系列 常用 的 内 置 方法 ， 如 表 3-6 所 示 。 
表 3-6 集合 的 常用 方法 


方法 摘 述 
add0 为 集合 添加 元 素 
clear0) 移 除 集合 中 的 所 有 元 素 
cCODY() 拷贝 集合 
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( 续 表 ) 
万 法 摘 述 
difference() 返回 多 个 集合 的 差 集 
difference update( 移 除 集合 中 的 元 素 ， 该 元 素 在 指定 的 集合 中 也 存在 
discard0 删除 集合 中 指定 的 元 素 
intersection(O 返回 集合 的 交集 
intersection UpdateO 删除 集合 中 的 元 素 ， 该 元 素 在 指定 的 集合 中 不 存在 
isdisjoint0) 判断 两 个 集合 是 否 包含 相同 的 元 素 , 如 果 包 含 , 返回 True, 否则 返回 False 
issubsetO) 判断 指定 集合 是 否 为 该 方法 的 参数 集合 的 子 集 
issuperset() 判断 该 方法 的 参数 集合 是 否 为 指定 集合 的 子 集 
popO 随机 移 队 元素 
remove() 移 除 指定 元 素 
nmetric differenceO 返回 两 个 集合 中 不 重复 元 素 的 集合 


symmetric difference Update0) 移 除 当前 集合 中 与 男 一 个 指定 集合 中 相同 的 元 素 ， 并 将 男 一 个 指定 集合 
中 不 同 的 元 率 插 入 当前 集合 中 

union() 返回 两 个 集合 的 并 集 

update() 给 集合 更 新 元 素 


本 章 实战 


在 本 章 实 战 中 ， 将 用 本 章 介 绍 的 序列 数据 结构 实现 杨辉 三 角 。 

杨 光 三 角 是 中 国 上 古代 数学 的 杰出 研究 成 果 之 一 ， 通 过 把 二 项 式 系数 图 形 化 ， 将 组 合 数 内 在 
的 一 些 代 数 性 质 直观 地 从 图 形 中 体现 出 来 ， 是 一 种 离散 型 的 数 与 形 的 结合 。 杨 瘤 三 角 具 有 许多 
规律 ， 但 这 里 我 们 需要 知道 的 是 以 下 几 个 性 质 : 

(1) 每 行 开 头 与 结尾 的 数 为 1。 

(2) 每 个 数 等 于 它 上 方 两 数 之 和 。 

G) 第 n 项 的 数字 有 nn 项， 第 n 行 数字 之 和 为 2n -1。 

(4) 第 n 行 的 第 mm 个 数 可 表示 为 Cr - 1，m -1)， 也 就 是 从 nn -1 个 不 同 元 素 中 取 m-1 个 
元 素 的 组 合 数 。 

(5) 第 下 行 的 第 mi 个 数 和 第 n-mtl 个 数 相等 ， 此 为 组 合 数 性 质 之 一 。 

(6) 每 个 数字 等 于 上 一 行 的 左右 两 个 数字 之 和 。 可 用 此 性 质 写 出 整个 杨辉 三 角 。 也 融 是 第 
nt+l 行 的 第 i 个 数 等 于 第 行 的 第 i- 1 个 数 和 第 i 个 数 之 和 ， 这 也 是 组 合 数 的 性 质 之 一 ， 可 表 
示 为 CtliFCOit Ci - 1)。 

(7) (atp)n 的 展开 式 中 的 各 项 系数 依次 对 应 杨辉 三 角 的 第 (xz+H) 行 中 的 每 一 项 。 

性 质 (1) 为 规律 前 提 ， 性 质 (4 和 性 质 (6) 是 杨辉 三 角 的 基本 性 质 。 

下 面 首先 来 分 析 编 程 思 路 。 

把 每 一 行 看 作 一 个 列表 ， 试 写 一 个 生成 器 ， 不 断 输出 下 一 行 的 列表 。 

对 于 每 一 行 ， 列 表 的 第 一 个 元 素 和 最 后 一 个 元 素 是 不 变 的 。 如 果 用 空 列表 工 = [表示 的 话 ， 
ZL[0]、LI] 是 不 变 的 。 


Br | 


第 一 步 : 先 找 规律 ， 抽 象 化 问题 。 

首先 可 以 观察 到 ， 第 一 行为 [1]， 直 接 赋 给 一 个 变量 : 初始 化 数列 p= [1]。 其 次 可 以 观察 到 ， 
下 面 的 每 一 行 的 开头 和 结尾 都 是 [1]， 那 么 我 们 可 以 推导 出 每 一 行 的 规律 为 [1]+…+[1]。 那 么 ， 
从 第 三 行 开始 中 间 的 [2]， 第 四 行 中 间 的 [3, 3]， 第 五 行 中 间 的 [4.6.4]， 等 等 ， 以 此 类 推 才 是 我 们 
需要 推导 的 部 分 。 

第 一 行 : [1], 设 p=[]1]。 

第 二 行 : [1]1+f1]， 设 p=[1,1]。 

第 三 行 : [1H[21H+[1], 设 p=[1,2,1]。 

第 四 行 : [1]+[3]H[3]H[1]， 设 p=[1,3,3,1]。 

经 过 找 规律 ， 可 以 发 现 ， 每 一 个 新 的 列表 中 间 的 部 分 ， 都 等 于 上 一 行列 表 的 第 0 个 元 素 + 
全 1 工 芋 元 过 第 二 二 第 天 不 元 吉 2 全 下 下 二 末了 3 二 条 

加 上 头 尾 也 就 是 [1] +[z[OHpT1JHP[LHEz[2]]…+[D， 比 如 上 面 第 三 行 ，p[0]=1、 p[1]=2、 
p[3]=[1]， 那 么 第 四 行 就 是 [1] +[1+2]#p[0]+p[1]+ [2+1 堪 P[2]+p[3]+ [1]… 后 面 以 此 类 推 。 

既然 核心 点 是 除去 首位 两 个 [1] 的 中 间 部 分 [p[0] + z[1]HHP[I] + P[2]]+HP[2] + P[3]]… 那 么 很 
容易 得 到 规律 [p[i| 十 p[it+1]|# foriin range(x)。 

示例 程序 如 下 : 


def yanelmi(t): 

# 打 印 第 一 行 和 第 二 行 

print ([1]) 

lme =|[].,1] 

print(line) 

# 打 印 从 第 三 行 开始 的 其 他 行 

torllin range(2.t): 
I 一 上 
# 按 规律 生成 该 行 除 两 端 以 外 的 数字 
for 1m range(0,len(lme) - 1): 

r.append(lmelil+lineli+11) 

检 巴 两 端的 数字 连 上 
lIme=|[1|+r+[1| 
prnt(lime) 


# 测 试 ， 打 印 杨辉 三 角形 的 前 6 行 
yanehu(6) 


运行 以 上 程序 ， 输 出 结果 如 下 : 


RESTART: C:/projects/chO2yhs]j.py 


[1, 4.,6,4,1] 
1 1. 和 10 10.5.1 
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本 章 小 结 


Python 中 常用 的 序列 结构 有 列表 、 元 组 、 字 典 、 字 符 串 、 集 合 等 。 大 部 分 可 达 代 对 象 也 文 
持 类 似 于 序列 的 语法 。 

本 半 主 要 对 字符 和 序列 数据 结构 进行 了 详细 介绍 。 首 先 介 绍 的 是 字符 串 的 常用 操作 ， 包 括 
计算 字符 串 的 长 度 、 大 小 写字 母 转 换 、 字 符 串 的 分 隔 与 拼接 、 字 符 串 的 查找 和 谷 换 、 计 算 字符 
串 中 指定 字符 出 现 的 次 数 、 去 除 字符 串 中 的 空格 与 特殊 字符 、 格 式 化 字符 串 ， 以 及 字符 串 的 编 
人 码 和 解码 操作 。 

然后 介绍 了 序列 的 常用 功能 ， 包 括 索 引 、 切 片 、 相 加 、 相 乘 ， 以 及 检查 某 个 对 象 是 否 是 序 
列 对 象 ， 如 何 计算 序列 的 长 度 、 最 大 值 和 最 小 值 等 。 

接 看 介绍 的 是 列表 、 元 组 、 字 上 典 、 集 合 。 这 四 类 数据 结构 是 实际 编程 中 使 用 最 多 的 数据 类 
型 。 一 定 要 牢记 哪些 类 型 是 可 修改 的 ， 哪 些 不 可 修改 。 可 修改 的 数据 类 型 和 不 可 修改 的 数据 类 
型 ， 从 确 层 的 工作 原理 上 看 就 是 不 一 样 的 ， 系 统 能 够 提供 的 方法 也 有 差别 。 


思考 与 练习 


1. 简 述 Python 的 序列 数据 类 型 中 ， 哪 些 是 可 修改 的 ， 哪 些 是 不 可 修改 的 。 

2. 摘 述 可 修改 数据 类 型 和 不 可 修改 数据 类 型 的 区 别 。 举 例 说 明 。 

3. 己 知 字 符 串 a ="aAsmr3idd4bugs7Dlsf9eAF"， 要 求 如 下 : 

(1) 请 将 a 字符 串 的 大 写 改 为 小 写 ， 小 写 改 为 大 写 。 

(2) 请 将 a 字符 串 的 数字 取出 ， 生 成 一 个 新 的 字符 串 并 输出 。 

4. 请 将 a 字符 串 反 转 并 输出 ， 比 如 'abc' 的 反 转 结果 是 'cba'。 

5. 假设 有 字符 串 a ='aAsmr3idd4bugs7Dlsf9eAF', 去 除 a 字符 串 内 的 数字 后 , 请 对 a 字符 
里 的 单词 重新 排序 (a~ 习 ， 重 新 生成 一 个 排序 后 的 字符 串 并 竹 出 (保留 大 小 写 , a 与 A 的 顺序 关系 
为 : A 在 a 的 前 面 。 例 如 AaBb)。 

6. 假设 存在 列表 对 象 list=[12,34,54,64,53,62,23]， 请 在 该 列表 对 象 上 实现 冒 泡 排序 。 

7. 购买 商品 时 假设 有 商品 列表 lsf# [" 手 机 ", "电脑 ", "鼠标 垫 ", "游艇 "]， 请 编程 实现 : 

(1) 在 控制 台 上 显示 所 有 的 商品 ， 格 式 为 : 序号 商品 名 称 。 例 如 : 1 手机 。 

(2) 如 果 输 入 Q， 结 束 购买 任务 。 

G) 输入 对 应 的 序号 ， 显 示 对 应 的 商品 ， 例 如 : 输入 1， 显示“ 手机 ”。 

(4) 如果 输 入 的 不 是 数字 ， 提 示 用 户 输入 有 误 。 

($5) 如 果 数 字 范 围 不 在 序号 范围 内 ， 提 示 用 户 输入 有 误 。 

8. 编写 程序 以 保存 用 户 名 和 密码 。 

(1) 用 户 名 和 和 密码 保存 在 如 下 数据 结构 中 : 

user lst=|[ 

{usermame': 'Zs". password': '1234'}. 
{usermmame': ']s', ‘password': 'asdf } 
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(2) 非法 字符 串 模板 board = ['zs', ']s', "ww']。 

(2) 可 连续 输入 用 户 名 和 密码 。 

(3) 如 果 想 终止 程序 ， 请 输入 Q 或 q。 

(4) 输入 用 户 名 时 ， 如 果 是 board 里 面 的 非法 字符 串 ， 将 非法 字符 串 蔡 换 成 同等 数量 的 *， 
例如 将 zs 苦 换 成 *¥， 然 后 添加 到 user list 中 。 

(5) 每 次 添加 成 功 后 ， 打 印 出 刚 添 加 的 用 户 名 和 密码 。 

9. 实现 整数 加 法 计算 器 。 

例如 ， 用 户 输 入 5$+8+21+…( 最 少 输入 两 个 数 )， 然 后 进行 分 了 唱 ， 最 后 再 进行 计算 ， 将 最 后 
的 计算 结果 添加 到 字典 中 ( 蔡 换 None)。 

10. 请 用 Python 语言 实现 超市 买 水 果 程 序 : 

(1) 输入 自己 口袋 里 有 多 少 钱 。 

(2) 展示 商品 的 序号 、 名 称 及 价格 。 

(3) 输入 要 买 商 品 的 序号 。 

(4) 输入 要 买 商 品 的 数量 。 

(5) 在 购物 车 中 显示 要 购买 水 果 的 名 称 及 对 应 的 数量 ， 以 及 自己 还 剩 多 少 钱 。 

(6) 如 果 序 号 输入 有 误 ， 就 提示 用 户 重新 输入 。 

(7) 如 果 钱 不 够 了 了， 提示 用 户 钱 不 够 ， 并 且 退 出 程序 。 


第 4 和 草 
流程 控制 语句 


编程 语言 中 的 流程 控制 语句 分 为 以 下 几 类 : 顺序 语句 、 分 六 语句 、 循 环 语句 。 其 中 ， 顺 序 
语句 不 需要 单独 的 关键 字 来 控制 ， 就 是 从 上 到 下 一 行 一 行 执行 ， 不 需要 特殊 的 说 明 。 本 章 主要 
介绍 的 是 分 文 语 名 和 循环 语句 ， 以 及 如 何 提前 跳出 分 文 和 终止 循环 。 

本 章 的 学 习 目 标 : 

e 让 分 文 结构 ， 包 括 单 分 文 让 结构 和 多 分 文 结 构 ; 
while 循环 结构 
for 循环 结构 : 
循环 扰 套 结构 
跳 转 语句 ， 包 括 continue、break 和 pass 语句 。 


EE 分 文 结 构 


条 件 分 文 语 句 通过 一 条 或 多 条 语句 (判断 条 件 ) 的 执行 结果 (True 或 Pao Da 了 哪个 分 
支 的 代码 块 。Python 提供 的 分 支 语句 为 if…else 语句 ， 没 有 提供 switch…case 语句 。 


4.1.1 单 分 支 if 结构 


条 件 分 文 语句 通过 一 条 或 多 条 语句 的 执行 结果 (Trme 或 False) 来 决定 执行 的 代码 块 。 站 后 面 
应 该 接 一 个 条 件 ( 结 果 为 布尔 类 型 )， 而 且 Python 是 通过 缩 进来 控制 条 件 块 的 ， 缩 进 数 相同 的 语 
句 在 一 起 组 成 一 个 语句 块 ， 这 和 PHP 的 站 …else 就 近 原 则 不 同 。 

单 分 文 直 结构 的 语法 格式 如 下 : 


这 判断 条 件 : 
代码 块 


如 果 单 分 文 语句 的 代码 块 只 有 一 条 语句 ， 可 以 把 站 语 句 和 代码 写 在 同一 行 ， 格 式 如 下 : 
这 判断 条 件 : 一 句 代 码 
以 上 语句 结构 中 ， 判 断 条 件 就 是 计算 结 打 必须 为 布尔 值 的 表达 式 ; 表达 式 后 面 的 冒号 不 能 


少 。 男 外 ， 迁 后 面 出 现 的 语句 ， 如 果 属 于 站 语句 块 ， 则 必须 使 用 相同 的 缩 进 等 级 。 
例如 ， 要 判断 指定 的 uid 是 不 是 root 用 户 ， 程 序 代码 如 下 : 
ud=0 
uld 一 0: 
print("root") 
也 可 以 写成 以 下 形式 : 
ud=0 
imid 一 0: 
print("root") 


执行 程序 ， 输 出 结果 如 下 : 


Toot 


4.1.2 ” 双 分 支 结 构 


对 于 双 分 文 下 …else 结构 ， 如 果 站 后 面 的 条 件 成 立 ， 则 执行 站 语句 块 ， 如 果 不 成 立 ， 就 执 
行 else 语句 块 。else 后 面 是 没有 条 件 的 ， 在 多 个 条 件 下 ，Python 中 的 else… 站 可 以 简写 成 elif。 
双 分 文正 …else 结构 的 语法 格式 如 下 : 
站 判断 条 件 : 
代码 块 


else: 
代码 块 


例如 ， 要 根据 用 户 id 打印 用 户 身 份 ， 示 例 代 但 如 下 : 
ud=100 
uld 一 0: 
prmnt( Toot ) 
else: 
print(“"Common user") 


输出 结果 如 下 : 


(COinirion user 


4.1.3 多 分 支 结 构 
多 分 支 结构 让 :elif…else 的 语法 格式 如 下 : 
站 判断 条 件 1: 
代码 块 1 
elif 判断 条 件 2: 
代码 块 2 
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elif 判断 条 件 ni: 
代码 块 1 
else: 
默认 代码 块 


例如 ， 要 根据 学 生 分 数 打印 字母 等 级 ， 示 例 代码 如 下 : 


SCOre = 88.8 
level = int(score % 10) 


lf level >= 10: 
print(Level A+') 
elf level 一 9: 
print(Level A') 
elf jevel — 8: 
print(Level B') 
elf level — 7: 
print(Level C") 
elit level 一 6: 
print(Level D'") 
else: 
print(Level E') 


得 出 结 采 如 下 : 


Level B 
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上 面 的 “判断 条 件 ” 中 的 表达 式 既 可 以 是 任意 表达 式 ， 也 可 以 是 任意 类 型 的 数据 对 象 实例 。 


只 要 判断 条 件 的 最 终 返 回 结果 的 真 值 测试 结果 为 Trme， 训 表 示 条 件 成 立 ， 相 应 的 代码 块 就 会 被 
执行 ， 人 否则 表示 条 件 不 成 立 ， 需 要 判断 下 一 个 条 件 。 


EI 循环 结构 


当 需 要 多 次 执行 茶 个 代码 语句 或 代码 块 时 ， 可 以 使 用 循环 语句 。Python 提供 的 循环 语句 有 


while 循环 语句 的 基本 形式 如 下 : 


while 判断 条 件 : 
代码 块 


while 循环 和 for 循环 。 需 要 注意 的 是 ，Python 中 没有 do…while 循环 。 此 外 ， 还 有 几 个 用 于 控 
制 循 环 执 行 过 程 的 循环 控制 语句 : break、continue 和 pass。 


4.2.1 while 循环 


当 给 定 的 “判断 条 件 ” 的 返回 值 的 真 值 测试 结果 为 True 时 ， 执 行 循环 体 中 的 “ 代 但 块 ”， 


侍 则 退出 人 循 坏 体 。 
例如 ， 要 循环 打印 数字 0~9， 示 例 代码 如 下 : 


count=0 

while count <= 9: 
print(count, end=" ") 
count += 1 


输出 结果 如 下 : 


01234367189 


4.2.2 ”while 死 循 环 
当 while 循环 的 判断 条 件 一 直 为 True 时 ，while 循环 体 中 的 代码 就 会 永远 循环 下 去 。 例 如 : 
while True: 
print(" 这 是 一 个 死 循 环 ") 
输出 结果 如 下 : 
这 是 一 个 死 循环 


这 是 一 个 死 循环 
这 是 一 个 死 循环 


此 时 可 以 通过 Ctrl + C 组 合 键 终止 运行 。 
4.2.3 while…'else 语句 
While…'else 语句 的 形式 如 下 : 


while 判断 条 件 : 
代码 块 
else: 
代码 块 


else 中 的 代码 块 会 在 while 循环 正常 执行 完 的 情况 下 执行 ， 如 果 while 循环 被 break 语句 中 
断 ， 那 么 else 中 的 代码 块 不 会 执行 。 以 下 示例 是 while 循环 正常 执行 结束 的 情况 (else 中 的 代码 
块 会 被 执行 ): 
count=0 
while count <—9: 
print(count, end=" ") 
count + 一 
else: 
print(end') 


执行 结果 如 下 : 
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0123456789end 
以 下 示例 是 while 循环 被 中 断 的 情况 (else 中 的 代码 块 不 会 被 执行 ): 


count=0 

while count <—9: 
print(count, end=' ") 
1{ count — 5: 

break 

count + 一 | 

else: 
print(end') 


输出 结果 如 下 : 


012343 


4.2.4 for 循环 
for 循环 通常 用 于 遍历 序列 (如 列表 、 元 组 、 字 符 串 、 集 合 、 范 围 和 映射 对 象 。for 循环 的 基 
本 语法 格式 如 下 : 


for 临时 变量 in 可 迁 代 对 象 : 
代码 块 
例如 ， 通 历 打 印 一 个 列表 中 的 元 素 ， 示 例 代 码 如 下 : 


names = [Tom, 'Peter', Jerw， Jack | 
for name mn names: 
print(name) 
执行 结果 如 下 : 
Tom 


Peter 


Jerry 
Jack 


对 于 序列 ， 也 可 以 通过 索引 进行 运 代 ， 代 码 如 下 : 


names = [Tom, Peter， Jerw， Jack | 
for1m ranse(len(names)): 
print(names[1]) 


执行 结果 与 上 面 的 相同 。 
另外 ， 还 有 for…else 循环 结构 ， 它 与 while…else 语句 基本 一 致 ， 这 里 不 再 赞 述 。 


4.2.5 ”循环 控制 语句 
循环 控制 语句 可 以 更 改 循环 体 中 程序 的 执行 过 程 ， 如 中 断 循 环 、 跳 过 本 次 循环 。 常 见 的 入 


5 上 


环 控 制 语句 如 表 4-1 所 示 。 


表 4-1 常见 的 循环 控制 语句 


循环 控制 语句 说 明 
break 终止 整个 循环 
continue 跳 过 本 次 循环 ， 执 行 下 一 次 循环 
Pass pass 语句 是 空 语句 ， 只 是 为 了 保持 程序 结构 的 完整 性 , 没有 什么 特殊 含义 。pass 


语句 并 不 是 只 能 用 于 循环 语句 ， 也 可 以 用 于 分 文 语 句 


例如 ， 通 历 0-9 郊 围 内 的 所 有 数字 ， 并 通过 循环 控制 语句 打印 其 中 的 奇数 ,示例 代码 如 下 : 


for1 mranee(10): 
1f1% 2 ©°— 人 0: 
continue 
print(1, end=" ") 


执行 代码 ， 输 出 结果 如 下 : 
| i 
又 如 ， 通 过 循环 控制 语句 打印 一 个 列表 中 的 前 3 个 元 素 ， 示 例 代码 如 下 : 


names = [Tom', Peter， ‘Jerry', Jack. Lily] 
for1m ranee(len(names)): 
下 1 > 一 3: 
break 
print(names[1]) 
执行 以 上 代码 ， 输 出 结果 如 下 : 
Tom 


Peter 
Jerry 


4.2.6 ”循环 认 套 


循环 散 套 是 指 在 一 个 循环 体 里 面 租 入 男 一 个 循环 ， 即 while、while…else、for、for…else 结 


构 互 相 租 套 。 
例如 ， 通 过 while 循环 打印 九 九 乘法 表 ， 示 例 代 码 如 下 : 
]=1 
whlle ] < 9: 
1= 1 
whle 1<=: 
prnt(%d*%od=%d' % (1 ], 1*]), end="\t") 
1+= 1 
printO 


| 936 和 


j+=1 


执行 以 上 代码 ， 输 出 结果 如 下 : 
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1*1=] 

1*2=2 2*2=4 

1*3=3 2*3=6 3*3=9 

l1*4-4 2*4-8 3*4=12 4*4=16 

1*S=3 2*$=]0 3*$=]$ 4*5=20 S$*$=—25 

1*6=6 2*6=12 3*6=]l8 4*6=24 S$*6=30  *6=36 

l=7 2*7=14 372] A4*728 SS*J35 6*=42 7*7=49 

1]*8=8 2*8=]6 3*8=24 4*8=32 3S*8=40 6*8=48 7*8=56 8*8=64 

1*9—9 2*9=]8 3*9—27 4*9=36 SS*9—45 6*9=54 7*9-63 8*9=72 9*9=8]1 
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又 如 ， 改 用 for 循环 打印 九 九 乘法 表 ， 示 例 代码 如 下 : 


for] mrange(l., 10): 
tor1im range(l, J+1): 
print(%d*%d=%%d' % (1, j, 1*]), end) 
1+= 1 
printO 
J 


代码 执行 的 输出 结果 相同 。 


本 章 实战 


4.3.1 ”判断 闻 年 


大 家 都 知道 ， 普 通 国 年 就 是 能 被 4 整除 但 不 能 被 100 整除 的 年 份 ， 能 被 400 整除 的 年 份 是 
世纪 国 年 。 下 面 通过 分 文 结构 来 判断 输入 的 年 份 是 不 是 国 年 。 

解决 办 法 一 : 

(1) 接收 年 份 数值 。 

(2) 判断 年 份 能 不 能 被 4 整除 ， 如 果 能 ， 再 判断 年 份 能 不 能 被 100 整除 。 

(3) 如 果 该 年 份 能 被 100 整除 ， 则 接着 判断 是 否 能 被 400 整除 。 

(4) 能 被 4、400 整除 的 年 份 ， 是 世纪 国 年 ， 和 否则 不 是 世纪 国 年 ; 能 被 4 和 100 同时 整除 的 
年 份 不 是 普通 国 年 ， 否 则 是 普通 国 年 。 

程序 代码 如 下 : 

year 二 int(input(" 输 入 年 份 : ")) 

i (year % 4)— 0: 

于 (year % 100) 一 0: 
(year % 400) 一 0: 
prnt(" 他 是 世纪 半年 ".format(yean)# 整 百年 能 被 400 整除 的 是 世纪 半年 
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else: 
print(" 他 不 是 世纪 半年 ".format(year)) 


else: 
print(" 介 是 普通 图 年 ".format(year)) # 非 整 百年 能 被 4 整除 的 为 普通 图 年 
else: 


print(" 他 不 是 普通 国 年 ".format(yean) 
解决 办 法 二 : 以 上 髓 套 分 文 结构 使 程序 代码 过 于 复 末 ， 这 里 灵活 运用 运算 符 ， 将 判断 是 否 
半年 的 判断 表达 式 写成 (vear % 4) 一 0 and (year % 100) != 0 or (year % 400) 一 0， 即 年 份 数 值 不 
能 同时 被 4 和 100 整除 ， 或 者 年 份 数值 能 被 400 整除 。 
程序 代 公 如 下 : 
year 二 int(input(" 请 输入 年 份 :")) 
i (year % 4) ©— 0 and (year % 100) != 0 or (year % 400) — 0: 
print(" 人 是 普通 闻 年 或 世纪 闪 年 " format(year)) 


else: 


print(" 人 0 不 是 普通 国 年 或 世纪 图 年 "format(year)) 


4.3.2 ”使 用 snaps 库 制 作 数 字 闸 钟 


我 们 可 以 使 用 循环 ， 通 过 snaps 库 的 draw text 函数 重复 显示 时 间 。 下 面 创建 一 个 程序 来 显 
示 羡 钟 消 县。 现在 显示 一 个 时 钟 ， 访 时钟 每 秒 更 新 一 次 。 


# EG6-18 Diaital Clock 
limport time 
1mport snaps 


while True: 
curent time = time.localtime() # 从 不 终止 的 循环 


hour string== str(current time.tm hour)  ”# 绪 取 时 间 

minute strng = str(curent time.tm mm) 

second string = str(current time.tm sec) 并 绑 得 包含 时 间 信息 的 字符 串 
time strng = hour stmget":+Hmnute stmet:+second strng 

snaps.display message(time string) # 显 示 时 间 字 符 串 
time.sleep(]) # 将 程序 暂停 1 秒 


该 程序 包含 一 个 循 坏 ， 它 不 断 地 从 时 钟 读 取 时 间 并 最 示 出 来 。 它 还 包含 对 sleep 函数 的 调 
用 ， 该 函数 使 程序 暂停 1 秒 。 


编程 语言 中 的 流程 控制 语句 分 为 以 下 几 类 : 顺序 语句 、 分 文 语句 、 循 坏 语 句 。 其 中 ， 顺 序 
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语句 不 需要 单独 的 关键 字 来 控制 ， 就 是 从 上 到 下 一 行 一 行 执行 ， 不 需要 特殊 的 说 明 。 分 支 语句 
主要 用 来 解决 在 存在 多 条 执行 路 径 的 情况 下 ， 选 择 其 中 哪 条 路 径 来 执行 。 循 环 语句 则 用 于 当 满 
足 某 种 条 件 时 反复 执行 指定 的 语句 块 用 ， 当 然 ， 在 循环 未 终止 之 前 ， 也 可 以 通过 continue 语句 
跳 过 本 次 循环 ， 或 者 通过 break 语句 跳出 循环 。 

任何 一 门 编程 语言 中 ， 分 支 结构 和 循环 结构 往往 都 处 处 用 到 ， 一 定 要 牢记 、 掌 握 。 


ER 思考 与 练习 


1. 使 用 while 循环 打印 1~100 的 和 。 

2. 使 用 for 循环 打印 字 生 A~Z。 

3. 使 用 while 循环 将 12345 转换 为 54321。 

4. 使 用 while 循环 将 12345 转换 为 '12345'"， 不 要 使 用 字符 串 。 

5. 假设 有 以 下 列表 : 

| 
{name': ' 田 敌 甄 ', 'age': '36', 'info': [(phone', '1383838438"), (address', ' 北 京 ]]}， 
{name': 柳岩 ', 'age': '33"', 'info': [(phone', '139809808"), (address', 河 丙 郑州 |)]}, 
{name': "林志玲 ' 'age': '42', 'info': [(phone', '13767655465"), (address', 河北 石家庄 让 }， 
{name': ' 柳 翡 苍 .age': '18', 'info': [(phone', '13737623"), (address', 山东 济 南 )]}. 

] 


通 历 列表 ， 打 印 : 姓名 ， 年 龄 ， 住 址 ， 电 话 。 


”99 用 


第 5 章 
正则 表达 式 


正则 表达 式 是 计算 机 科学 领域 中 的 一 个 概念 。 正 则 表达 式 使 用 单个 字符 串 来 描述 、 匹 配 一 
系列 符合 某 种 句法 规则 的 文本 。 在 很 多 文本 编辑 占 里 ， 正 则 表达 式 通 常 被 用 来 检索 、 蔡 换 那 些 
匹配 茶 种 模式 的 文本 。 许 多 程序 设计 语言 都 支持 利用 正则 表达 式 进 行 字 符 串 操作 。 例 如 ，Pel 
语言 中 就 内 建 了 一 个 功能 强大 的 正则 表达 式 引 擎 。 正 则 表达 式 这 个 概念 最 初 是 从 UNIX 中 的 工 
具 软 件 (例如 sed 和 grep) 普 及 开 的 。 正 则 表达 式 通 常 缩写 成 regex。 

Python 自 1.5 版 本 起 增加 了 re 模块 , 提供 了 Perl 风格 的 正则 表达 式 模 式 。re 模块 使 Python 
语言 拥有 全 部 的 正则 表达 式 功能 。 

可 使 用 compile 图 数 根据 模式 字符 串 和 可 选 的 标志 参数 生成 正则 表达 式 对 象 。 正 则 表达 式 
对 象 拥有 一 系列 方法 用 于 正则 表达 式 的 匹配 和 普 换 。re 模块 也 提供 了 与 这 些 方 法 功能 完全 一 致 
的 函数 ， 这 些 函 数 使 用 模式 字符 串 作为 它们 的 第 一 个 参数 。 本 章 主 要 介绍 Python 中 常用 的 正则 
表达 式 处 理 函 数 。 


本 章 的 学 习 目标 : 
。 了 解 常用 元 字符 的 含义 及 作用 
。 掌握 te 模块 中 的 常用 功能 函数 
。 能 够 使 用 正则 来 判断 一 些 常用 的 字符 种 规 则 ， 如 手机 号 码 、 电 子 邮箱 等 。 


ES 认识 正则 表达 式 


正则 表达 式 本 身 是 一 种 小 型 的 、 高 度 专业 化 的 编程 语言 ， 在 Python 中 ， 通 过 内 和 嵌 集 成 re 
模块 ， 开 发 人 员 可 以 直接 调用 来 实现 正则 匹配 。 正 则 表达 式 被 编译 成 一 系列 的 字 节 码 ， 然 后 由 
C 编写 的 匹配 引擎 执行 。 
5.1.1 元 字符 

首先 介绍 组 成 模式 字符 串 的 特殊 字符 ， 表 5-1 所 示 为 普通 字符 和 元 字符 。 


表 5-1 正则 表达 式 中 的 普通 字符 和 元 字 稚 


字符 模式 字符 串 。 | 匹配 字符 


abc 
匹配 任意 除 换行 符 "n" 外 的 字符 (在 DOTALL 模式 中 也 能 匹 i 
配 换行 符 
\ 转 义 字符 ， 使 后 一 个 字符 改变 原来 的 意思 a 
: ab:abccc 
十 匹配 前 一 个 字符 1 次 或 无 限 次 abc+ abc:abccc 
? 匹配 一 个 字符 0 次 或 1 次 ab:abc 
人 匹配 字符 串 的 开头 ， 在 多 行 模式 中 匹配 每 一 行 的 开头 i 
$ 匹配 字符 串 的 末尾 ， 在 多 行 模式 中 匹配 每 一 行 的 末尾 i 
| 匹配 的 | 左右 表达 式 中 的 任意 一 个 ， 从 左 到 右 匹配 ， 如 果 | 没 a 
有 包括 在 圆 括号 中 ， 范 围 是 整个 正则 表达 式 
0 {ml} 匹配 前 一 个 字符 m 次 ，{mn} 匹 配 前 一 个 字符 mn 次 。 ei 
若 省 略 a， 则 匹配 m 至 无 限 次 
站 字符 集 。 对 应 的 位 置 可 以 是 字符 集中 的 任意 字符 。 字 符 集 abeaceade 
中 的 字符 可 以 逐个 列 出 ， 也 可 以 给 出 范围 ， 如 [abc] 或 [a-c] 
[^abc] 表 示 取 反 ， 即 非 abc 
所 有 特殊 字符 在 字符 集中 都 失去 它们 原 有 的 特殊 含义 ， 用 \ 
反 斜 杠 转 义 恢复 特殊 字符 的 特殊 含义 
0 被 插 起 来 的 表达 式 将 作为 分 组 ， 从 表达 式 左边 开始 每 遇 到 | (abc){2}a(12345 | abcabca456c 


一 个 分 组 的 左 插 号 “(”， 将 编号 加 1 6)c 
分 组 表达 式 作 为 整体 ， 可 以 后 接 数量 词 。 表 达 式 中 的 | 仅 在 
分 组 中 有 效 


这 里 需要 强调 一 下 反 斜 杠 \ 的 作用 : 
。 反 斜 杠 后 面 跟 元 字符 ， 表 示 去 除 特殊 功能 (即将 特殊 字符 转 义 成 普通 字符 )。 
。 反 斜 杠 后 面 跟 普 通 字符 可 实现 特殊 功能 ( 即 预定 义 字符 )。 

示例 如 下 ; 


>>> mport re 

>>> a-Te.search(r (ta)(feD)haha2'.timateihahatel tnafetlhahatma').eroup() 
>>> print(a) 

tafeihahafel 


5.1.2 ”预定 义 字 符 集 
预定 义 字符 集 可 以 写 在 字符 集 [...] 中 ， 这 些 字符 集 如 表 5-2 所 示 。 


表 5-2 预定 义 字符 集 
字符 匹配 字符 中 
y al 
D | 接 家 rd an |a 
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( 续 表 ) 


字符 9 圳 匹配 字符 捉 


\S 导 C 
‘\S abc 
\w abc 


\W 

WA 

忆 abc\7 i 
(空格 )abc( 空 格 ) 
albc 


由 匹配 单词 边界 , 匹配 的 单词 边界 不 包含 在 匹配 中 例如 , 'er\b' 


ase 
awe | 

ac 
az 


可 以 匹配 "never" 中 的 'er， 但 不 能 匹配 "verb" 中 的 'er 


'‘B [和 bj aBbc abc 


这 里 需要 强调 一 下 对 单词 边界 的 理解 ， 示 例 代 码 如 下 : 


w=re.findall\btina',tian tinaaaa') 
print(w) 

s=Tée.findall(\btina','tian tinaaaa'") 
printts) 

v= Tre.findall("\btina','tan#tinaaaa') 
print(v) 
a=re.findall(\btina\b','tian#tina(Vaaa') 
print(a) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
[] 
[tina'] 
[ina'] 
[ina'] 
5.1.3 ”特殊 分 组 用 法 
正则 表达 式 还 可 以 用 于 对 字符 串 进行 分 组 匹配 ， 如 表 5-3 所 示 。 
表 5-3 分 组 匹配 


字符 模式 字符 串 匹配 字符 串 


(?P<name>) 分 组 ， 除 了 原 有 的 编号 外 ， 表 指定 一 个 额外 | GQ?P<id>abc){2} abcabc 
的 别名 

(7P-name) 引用 别名 为 =name> 的 分 组 匹配 到 字符 串 CP=id>\d)abc(CP=-id) | labcl 

Sabc4 


\<number> 引用 编号 为 <number> 的 分 组 匹配 到 字符 串 Gdabc\l labcl 
sabcs 


103 


re 模块 使 Python 语言 拥有 全 部 的 正则 表达 式 功 能 。 本 节 主 要 介绍 re 模块 中 的 常用 功能 
5.2.1 re.compile 痕 数 

re.compile 函数 主要 用 于 把 正则 表达 式 编译 成 正则 表达 式 对 象 . 可 以 把 那些 钊 用 的 正则 表达 
式 编译 成 正则 表达 式 对 象 ， 这 样 可 以 提高 一 点 效率 。 

re.compile 函数 的 语法 格式 如 下 : 

Te.complle(pattem .flags=0) 

其 中 ， 参 数 pattem 指 的 是 编译 时 用 到 的 表达 式 字 符 串 。 人 参数 flags 指 的 是 编译 标志 位 ， 用 
于 修改 正则 表达 式 的 匹配 方式 ， 如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 第 用 的 标志 如 表 5-4 所 示 。 

表 54 常用 的 标志 


标志 含义 
re.S(DOTALL) 匹配 包括 换行 符 在 内 的 所 有 字符 
TeIUGNORECASE) 使 匹配 对 大 小 写 不 敏感 
re.L(LOCALE) 做 本 地 化 识别 (ocale-aware) 匹 配 
re.M(MULTILINE) 多 行 匹 配 ， 影 响 ^ 和 $ 
re.X(VERBOSE) 通过 给 予 更 灵活 的 格式 以 便 将 正则 表达 式 写 得 更 易于 理解 
Te 根据 Unicode 字符 集 解析 字符 ， 这 个 标志 会 影 啊 wW、\W、\b、\B 
示例 程序 如 下 : 


i1mport re 

tt= "Tina ls a good girl. she 1s cool clever., and so on..." 
IT = Te.complle(T\W*oo\Ww*') 

print(r.findall(tt)) ”# 盘 找 所 有 包含 '00' 的 单词 


执行 以 上 程序 ， 输 出 结果 如 下 : 
[good. cool] 
5.2.2 re.match 哨 数 


re.match 函数 党 试 从 字符 串 的 起 始 位 置 死 配 , 如 果 起 始 位 置 死 配 不 成 功 的 话 , 就 返回 None。 


re.match(patterm, string, flags=0) 


其 中 ， 参 数 pattem 指 的 是 匹配 用 的 正则 表达 式 ，string 指 的 是 要 [匹配 的 字符 串 ，flags 指 的 
是 标志 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 ， 如 是 售 区 分 大 小 写 、 多 行 匹配 等 。 
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当 匹 配 成 功 时 ，re.match 函数 返回 匹配 的 对 象 ， 否 则 返回 None。 
可 以 使 用 groupun) 或 groups0 函 数 来 获取 匹配 表达 式 ， 如 表 5-5 所 示 。 


表 5-5 group(num) 或 groups() 函 数 


函数 摘 述 
sroupnumn=0) 匹配 的 整个 表达 式 的 字符 串 ， 对 于 group0 可 以 一 次 输入 多 个 组 号 。 在 这 
种 情况 下 ， 将 返回 一 个 包含 那些 组 所 对 应 值 的 元 组 

coTOUDSO 返回 一 个 包含 所 有 小 组 字符 串 的 元 组 

示例 程序 如 下 : 

Import re 

print(re.match(www', wwwTunoob.com').span0) # 在 起 始 位 置 匹配 

print(re.match('com', Www.runoob.com')) # 不 在 起 始 位 置 匹配 

执行 以 上 程序 ， 输 出 结果 如 下 : 

《0. 3) 

None 


5.2.3 re.search 限 数 

re.search 函数 扫描 整个 字符 串 并 返回 第 一 个 成 功 的 匹配 。 语 法 格式 如 下 : 

re.search(pattern, string. flags=0) 

其 中 ，pattern 指 的 是 匹配 用 的 正则 表达 式 ，string 指 的 是 要 匹配 的 字符 串 ; flags 指 的 是 标 
志 位 ， 用 于 控制 正则 表达 式 的 匹配 方式 ， 如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 

当 匹 配 成 功 时 ，re.search 国 数 返回 匹配 的 对 象 ， 否 则 返回 None。 和 re.match 国 数 一 样 ， 
re.search 了 轴 数 也 可 以 使 用 groupunm) 或 groups0 函 数 来 获取 匹配 表达 式 。 示 例 程 序 如 下 : 

import re 

print(re.search(www', Www.runoob.com'").spanO) # 在 起 始 位 置 匹 配 

print(re.search(com', Www.runoob.com").spanO0) “ # 不 在 起 始 位 置 匹配 

执行 以 上 程序 ， 输 出 结果 如 下 : 

(0, 3) 

(11, 14) 

re.match 与 re.search 的 区 别 是 , re.match 只 匹配 字符 串 的 开头 ， 如 果 字 符 串 的 开头 不 符合 正 
则 表达 式 ， 则 匹配 失败 ， 返 回 None; 而 re.search 匹配 整个 字符 串 ， 直 到 找到 匹配 。 示 例 程 
序 如 下 : 

mport re 


line = "Cats are smarter than dogs" 
matchOb] = re.match( rdogs', lne, re.Mlre.1) 
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1{ matchOb: 

print("match --> matchOb].eroup() : ", matchOb].eroup()) 
else: 

print("No match!!") 

matchOb] = re.search( rT dogs'. Ine, re.Mlre.D 

1{ matchOby: 

print("search --> matchOb].eroupQ : ". matchOb].eroup()) 
else: 

prin( "No match!!") 

执行 以 上 程序 ， 输 出 结果 如 下 : 


No match!! 
search --> ImatchObl.groupO : dogs 


5.2.4 re.findall 画 数 

re.findall 函数 用 于 遍历 匹配 ， 获 取 字 符 串 中 所 有 匹配 的 字符 串 ， 返 回 一 个 列表 。 语 法 格式 
如 下 : 

re findall(pattem. string, flags=0) 

例如 : 


p=Te.compile(\d+) 
print(p.findall(ol1n2m3k4")) 


执行 以 上 程序 ， 输 出 结果 如 下 : 

EE 过 总 4] 

义 如 : 

Iimport re 

tt= "Tina 1s a pg00d pl she 1s cool clever, and so on..." 
IT= Te.compile(T\W*oo\Ww™*') 


printGr.findall(tt)) 
print(re.findall(r(Ww)*oo(w)'.tt)) #O 表 示 子 表达 式 


执行 以 上 程序 ， 输 出 结果 如 下 : 
['good., 'cool | 
[Cg;'d), (Cc, 1 

5.2.5 refinditer 消 数 


re.finditer0 函 数 用 于 搜索 字符 串 ， 返 回 一 个 能 顺序 访问 每 一 个 匹配 结果 (Match 对 象 ) 的 友 代 
器 。 找 到 匹配 的 所 有 子 串 ， 并 把 它们 作为 一 个 迭代 器 返回 。 语 法 格式 如 下 : 
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re.finditer(pattem, string. flags=0) 
示例 程序 如 下 : 


iter = re.finditer(r\d+,12 dmnm44ers dummme, 11 .10 .…) 
for 1 m iter: 

printQ) 

print(i.groupO) 

prntli.span()) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
< sre.SRE Match oblect span=(0., 2). match='12> 
12 
(0, 2) 
< sre.SRE Match oblect span=(8, 10). match= 44> 
A4 
(8, 10) 
< sre.SRE Match object: span—(24., 26), match=11> 
11 
(24. 26) 
< Sre.SRE Match oblect span=(31. 33). match= 10> 
10 
(31. 33) 


5.2.6 re.split 毅 数 


前 面 已 经 介绍 过 ，re.split 函数 按照 能 够 匹配 的 子 串 将 字符 串 分 隅 后 返回 。 可 以 使 用 re.split 
函数 来 分 阳 字 符 串 ， 如 re.split(r"\st', texD， 这 会 将 字符 串 按 空格 分 隅 成 一 个 单词 列表 。 
语法 格式 如 下 : 


re split(pattem. string[, maxsplit) 
其 中 ， 可 选 参数 maxsplit 用 于 指定 最 大 分 隔 次 数 ， 不 指定 的 话 将 全 部 分 隔 。 例 如 : 
print(re.split\d+','oneltwo2three3four4five5'")) 

执行 结果 如 下 : 


['one', two', 'three', four 'five', "] 


5.2.7 re.sub 痕 数 


re.sub 函数 使 用 re 蔡 换 字符 串 中 每 一 个 匹配 的 子 串 ， 然 后 返回 奉 换 后 的 字符 串 。 语 法 格式 
如 下 : 


re.sub(pattern, repl, strme, count) 


示例 程序 如 下 : 


_107 | 


import re 
text = "JGood ls a handsome boy, he 1s coolL clever, and so on..." 


print(re.sub(m"\s+', ~, text)) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
JGood-ls-a-handsome-bov.-he-ls-cool-clever,-and-so-on ... 


其 中 ， 第 2 个 参数 是 奉 换 后 的 字符 串 ， 本 例 中 为 -': 第 4 个 参数 指定 蔡 换 个 数 ， 默 认为 0， 
表示 每 个 匹配 项 都 替换 。 

另外 ，re.sub 消 数 还 允许 对 匹配 项 的 蔡 换 进行 复杂 的 处 理 。 例 如 : 

re.sub(r"s'. lambda m: [+ m.eroup(0) 十 小,text 0); 

上 述 语句 会 将 字符 串 中 的 空格 '' 替 换 为 [上 1。 示例 程序 如 下 : 

1mport re 

text = "JGood ls a handsome boy. he ls cool clever, and so on..." 

print(re.sub(m™\s+', lambda m:|'+m.eroup(0)+], text.0)) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

JGood| hs|[ jal jhandsome[ jboy.[ jbel jsl jcooLl Jclever.[ jandl jsol lon... 


5.2.8 re.subn 明 数 
re.subn 图 数 返 回 蔡 换 次 数 ， 语 法 格式 如 下 : 
subn(pattem. Tepl stmg. count=0, flags=0) 
示例 程序 如 下 : 


print(re.subn([1-21,'A'.1234S6abcdef')) 
print(re.sub("g.t","have",T get A. I gotB .I[ eut COC’")) 
print(re.subn("g.t","have",T get A, I gotB .I eutC")) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
(AA3456abcdef, 2) 


Ihave A. IhaveB .IhaveC 
(Thave A, I have B .I haveC'.3) 


5.2.9 注意 事项 


1. re.match 与 re.search 函数 的 区 别 


re.match 鲍 数 只 匹配 字符 串 的 开头 ， 如 果 衬 符 串 的 开头 不 符合 正则 表达 式 ， 则 匹配 失败 ， 
靖 数 返回 None; 而 re.search 函数 匹配 整个 字符 串 ， 直 到 找到 一 个 匹配 。 示 例 程序 如 下 : 
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a=re.Search(|d| abc33").sgroupOU 
print(a) 
p=re.match( hdl."abc33") 


print(p) 

执行 以 上 程序 ， 输 出 结果 如 下 : 
3 

None 


2. 贪 区 匹配 与 非 仿 林 匹配 


后 面 不 珊 ? 的 *、+ 和 ?等 痢 是 贫 禁 匹配 , 也 就 是 尽 可 能 匹配 ; 但 后 面 加 上 ?成 为 *? 、+? 、? 


就 变 成 了 非 信 禁 匹 配 。 示 例 程序 如 下 : 
a=re.fmdall(r"aN\d+?)",a23b'") 

print(a) 

b=re.findall(r"aN\d+)",a23b") 

print(b) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

[2] 

[23] 

义 如 : 
a=re.match(<(.*)>""<Hl>title<H1>').eroupO 
print(a) 
b=re.match(<(.*7)>""<Hl1>title<H1>").groupO 
print(b) 

执行 以 上 程序 ， 输 出 结果 如 下 : 
<Hl>ttle<H]1> 

<H1> 

册 如 : 


a=TITefndallrm'a4d+yb".a3333b) 
print(a) 
b=re.findall(r"a(\d+r?)b",a3333b") 
prnt(b) 

执行 结 采 如 下 : 

[3333 

[3333] 
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这 里 再 要 注意 的 是 ， 如 果 前 后 均 有 限定 条 件 ， 束 不 存在 什么 贫 柳 模式 了 ， 非 匹配 模式 失效 。 
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本 章 实战 


本 节 将 综合 前 面 介 绍 的 正则 表达 式 相 关 知 识 ， 编 写 一 个 可 以 获取 电子 邮箱 、URL 网 址 、 手 
机 号 、 卫 地 址 的 程序 。 

要 从 文本 中 提取 电子 邮箱 、URL、 手 机 号 、 卫 地 址 等 ， 使 用 正则 表达 式 非常 容易 实现 。 

电子 邮箱 的 形式 如 下 : 邮箱 名 四 服务 器 域名 .一 级 域名 .二 级 域名 ， 例 如 
admin(@example.com.cn。 邮 箱 名 和 服务 器 域名 可 以 由 大 小 写字 母 、 数 字 、 连 接 符 (-)、 和 英文 点 号 
())、 下 划 线 (_) 组 成 ; 域名 则 用 小 写字 母 表 示 。 因 此 ， 用 于 获取 电子 邮箱 的 正则 表达 式 为 : 

[a-z0-9\W\-+ H+H@[a-z0-9W-+ HN\fa-z]t 

手机 号 包括 11 位 数字 ， 形 如 1XX XXXX XXXX， 因 此 ， 用 于 获取 手机 号 的 正则 表达 式 可 
表示 为 1d{10}。 如 果 是 国际 长 途 ， 还 需要 加 上 国家 区 号 ， 此 处 留 给 大 家 思考 。 

URL 网 址 的 形式 如 下 : 协议 :Wwww. 二 级 域名 .一 级 域名 .顶层 域名 ， 例 如 
https://verify.longleding.com。 用 于 提取 URL 的 正则 表达 式 如 下 : 

http[s]2:/2:[a-zA-Z][o-9]I[$- @.&+]I[!*.]9:%[0-9a-fA-F][O-9a-fA-FD) Na-zA-Z1+ wt\+{a-zA-Z0-9V ]+ 

IP 地 址 有 IPv4 和 IPV6 两 种 版 本 ， 这 里 以 前 者 为 主 ， 形 如 192.168.1.1， 由 四 组 点 分 十 进 制 
数组 成 。 因 此 ， 用 于 提取 下 地 址 的 正则 表达 式 如 下 : 

\b@:02:25[0-51|2[0-41[0-91|[011?[0-9][0-913N\.){3:07:23[0-51]|2[0-4][0-9]|[011?[0-9][0-91)b 

程序 代码 如 下 : 

# encoding: utt-8 

1mport re 

# 上 自 定 义 获 取 电 子 邮 件 的 函数 

def get findAll emails(text): 


:param text: 文本 
Tetum: 返回 电子 邮件 列表 


emalls = re.findall(r"[a-z0-9\\-+ IH [a-z0-9\\-+ |+\[a-zl+t", text) 
retum enlalls 


# 目 定 义 获 取 手 机 号 的 函数 
def get findAll mobiles(text): 


:param text: 文本 
Tetum: 返回 手机 号 列表 


mobiles =Teftndallr NN\d{10}", text) 
Tetum mobiles 


110 


第 5 章 正则 表达 式 


# 自 定 义 获取 URL 地 址 的 函数 
def get findAll urls(text): 

:param text: 文本 

Tetum 返回 url 列表 


urls=re.findall(r"(http[s]?://:[a-zA-Z]|[0-9]|[$- (2.&+]|[*. (2:%0[0-9a-£A-FI[0-9a-fA-F])))([a-zA-Z|+ 
‘wt\.+[a-zA-Z0-9V ]H)"texb 

urls=list(sum(urls.())) 

urls=[x for x m urls 1f x!="| 


Tetum urls 


# 自 定义 获取 四 地址 的 函数 

def get findAll ips(text): 
:param text: 文本 
:Tetum: 返回 ip 列表 


ips = Te.findall(r™\b(?:(3:25[0-51]|2[0-41[0-9]|[011?[0-91[0-912)\.)43}C7:25[0-51l2[0-4][0-9]1011?[0-9][0-91?)b", 
text) 

Tetum ps 

i name Oo—' mam “ 
content = "Please 47.92.2.58:443 contact 127.0.0.1 15988455173 Us 18720071239 
https://blog.csdn.net/u013421629/ at https://www.ynbal.com/ contact(Vqq.com for further mformation 
1973336419(qq.com You can also glve feedbacl at fedbackyllbalcom 
emalls=get findAll emails(text—=content) 


print(emails) 
moblies=get fndAll moblles(text=content) 
print(moblies) 

urls=get findAll urls(text=content) 
print(urls) 

ips=get fmdAl ips(text=content) 
print(ps) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
RESTART: C:/projects/chOSbig.py 


[contact(Vqq.com', "1973536419(Vqqg.com', ‘feedback(@ynbai.com | 


[1$98843S173 18720071239 /| 
[Please 47.92'，contact 127.0. https://blog.csdn.net/u013421629/, https:/Wwww.yubal.com/, ‘contact((Wqq.com.'. 


feedbackwylibalLcom | 
[47.92.2.58,'127.0.0.1] 
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EE 本 章 小 结 


正则 表达 式 使 用 单个 字符 串 来 描述 、 匹 配 一 系列 符合 某 种 句法 规则 的 文本 。 在 很 多 文本 编 
辑 器 里 ， 正 则 表达 式 通 常 被 用 来 检索 、 蔡 换 那 些 匹配 某 种 模式 的 文本 。 在 Web 应 用 中 ， 正 则 表 
达 式 主要 用 来 判断 表单 输入 内 容 是 否 符合 期 望 的 规则 ， 如 电子 邮箱 格式 、 网 址 格式 、 电 话 号 码 
格式 等 。 

Python 自 1.5 版 本 起 增加 了 re 模块 ,提供 了 Perl 风格 的 正则 表达 式 模 式 。re 模块 使 Python 
语言 拥有 全 部 的 正则 表达 式 功能 。 

本 章 首先 介绍 了 正则 表达 式 的 基础 内 容 ， 包 括 元 字符 、 预 定义 字符 集 和 特殊 分 组 用 法 ; 其 
次 介绍 了 Python 中 用 于 实现 正则 功能 的 re 模块 的 所 有 常用 功能 函数 。 通 过 本 章 的 学 习 ， 你 应 
能 够 在 实际 项 目 中 人 处理 一 些 基本 上 日常 见 的 字符 模式 匹配 需求 。 


ER 思考 与 练习 


1. 举 一 个 例子 ， 使 用 正则 表达 式 来 处 理 转 义 字符 。 

2. 判断 字符 串 是 否 全 部 小 写 。 

3. 使 用 正则 表达 式 ， 提 取 首 字母 的 缩 与 词 。 例 如 ， 假 设 字符 串 为 Federal Emergency 
ManagementAgency， 那 么 提取 到 的 首 字母 为 FEMA。 

4. 在 处 理 自然 语言 时 ， 如 果 以 逗号 分 阳 较 大 的 数字 ， 就 会 出 现 问 题 。 好 好 的 数字 就 被 人 逗 号 
股 解 了 ， 因 此 ， 可 以 先 下 手 把 数 字 处 理 干净 (去 挥 如 号 )。 

5. 将 中 文 表示 的 年 份 转换 成 数字 表示 的 年 份 ， 例 如， 将 “一 九 四 九 年 ”转换 为 “1949 年 ” 

6. 输入 手机 号 码 ， 判 断 手 机 与 码 是 否 为 11 位 ， 以 及 是 否 为 1 开头 的 数字 。 

7. 给 定 一 串 字符 ， 判 断 是 否 是 手机 号 。 

8. 请 芝 试 写 一 个 验证 电子 邮箱 的 正则 表达 式 。 

版 本 一 : 可 以 验证 出 类 似 的 电子 邮箱 : 


someone((Vemail.com 
bill.eates(C(Wmicrosotft.com 


版 本 二 : 可 以 提取 出 市 名 字 的 电子 邮箱 。 


tom(Wvoyager.ore => Tom Parls 
bob(Vexample.com => bob 
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限 数 是 程序 设计 的 重要 部 分 之 一 。 函 数 是 组 织 好 的 、 可 重复 使 用 的 、 用 来 实现 单一 或 相关 
联 功 能 的 代 人 码 段 。 可 使 用 函数 将 一 个 大 型 解决 方案 分 解 为 多 个 组 件 ， 并 创建 可 供 程 序 使 用 的 行 
为 库 。 前 和 面 介绍 的 程序 曾 用 到 Python 提供 的 函数 (如 print 函数 )。 本 章 将 学 习 如 何 创建 和 使 用 日 
己 的 函数 。 你 将 学 习 如 何 为 函数 提供 要 处 理 的 数据 ， 以 及 程序 如 何 接 收 函 数 返 回 的 结果 。 函 数 
使 程序 变 得 更 简洁 ， 更 易于 管理 。 


本 章 的 学 习 目 标 : 

e 掌握 创建 函数 、 调 用 函数 的 方法 ; 

e 和 车 握 如 何 问 图 数 传递 参数 ; 

e 本 解 函数 如 何 返 回 值 ， 如 何 使 用 返回 值 ; 
e 本 解 函 数 内 变量 的 作用 域 ; 


图 数 是 组 织 好 的 、 可 重复 使 用 的 、 用 来 实现 单一 或 相关 联 功 能 的 代码 段 ， 能 提高 应 用 的 模 
块 性 和 代码 的 重复 利用 率 。 Python 提供 了 许多 内 建 函 数 , 比如 print 函数 。 也 可 以 目 己 创建 函数 ， 
称 为 用 尸 目 定义 函数 。 


6.1.1 创建 函数 
创建 函数 时 使 用 def 关键 字 ， 一 般 格式 如 下 : 


def 函数 名 (参数 列表 ): 
函数 体 
默认 情况 下 ， 参 数值 和 参数 名 称 是 按 函 数 声明 中 定义 的 顺序 匹配 起 来 的 。 
在 定义 想 要 的 功能 函数 时 ， 需 要 遵从 以 下 原则 : 
e 函数 代码 块 以 def 关键 字 开 头 ， 后 接 函 数 标 识 符 名 称 和 一 对 圆 括号 0。 
e 传 入 的 任何 参数 和 目 变 量 必须 放 在 一 对 圆 括 与 之 间 ， 在 这 对 圆 括号 之 间 可 以 定义 参数 。 


e 函数 的 第 一 行 语 句 可 以 选择 性 地 使 用 文档 字符 串 一 一 用 于 存放 函数 说 明 。 

e 上 国 数 内 容 以 冒号 起 始 ， 并 且 缩 进 。 

e 使 用 “retum[ 表 达 式 |]” 形 式 结 束 函数 ， 选 择 性 地 返回 一 个 值 给 调用 方 。 不 融 表 达 式 的 
returmn 语句 相当 于 返回 None。 

创建 函数 的 示例 如 下 : 

def hello( ): 
print("Hello World") 


hello() 

程序 输出 如 下 : 

Hello World! 

以 上 创建 的 hello 函数 没有 参数 传递 。 实 际 上 ，Python 和 其 他 编程 语言 一 样 ， 其 函数 是 可 
以 传递 参数 的 ， 示 例如 下 : 


# 面积 计算 函数 
defarea(width height): 
Tetum width * height 


def prmnt welcome(name): 
print(" Welcome". name) 


print welcome("Runoob") 

w=4 

h=5 

print(“width =", w., " height =", h, " area =", area(wW. h)) 


执行 以 上 程序 ， 输 出 结果 如 下 : 

Welcome Runoob 

Wildth=4 belght=S area=20 
6.1.2 调用 阔 数 


创建 冰 数 后 ， 也 就 同时 给 了 函数 名 称 ， 指 定 了 函数 里 包含 的 参数 和 代码 块 结构 ， 函 数 的 基 
本 结构 束 完 整 了 。 接 下 来 ,这 个 函数 可 以 通过 男 一 个 函数 调用 执行 ， 也 可 以 直接 从 Python 命令 
提示 符 执 行 。 

在 调用 函数 的 时 候 ， 需 要 知道 函数 的 名 称 和 参数 ， 例 如 : 

print(my_abs(-3)) 

执行 函数 ， 输 出 结果 为 3。 

Python 内 置 了 很 多 有 用 的 图 数 ， 可 以 直接 调用 ， 比 如 上 面 求 绝对 值 的 图 数 abs， 它 只 有 一 


个 参数 。 
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图 数 名 其 实 就 是 指 回 函数 对 象 的 引用 ， 完 全 可 以 把 图 数 名 赋 给 变量 ， 这 相当 于 给 函数 起 了 
“别名 ”， 例 如 : 


a=abs # 变 量 a 指向 abs 函数 
print(a(-2)) ”# 通 过 变量 a 调用 abs 函数 


执行 程序 ， 输 出 结果 为 2。 
在 调用 函数 的 时 候 ， 如 果 传 入 的 参数 数量 不 正确 ， 就 会 出 现 TypeError 错误 ， 并 且 会 给 出 
提示 。 例 如 ， 函 数 abs 只 能 接收 一 个 参数 ， 传 入 两 个 就 会 报错 : 


>>> print(abs(-1,-2)) 
Traceback (most Tecent call ]ast): 
File "<pyshell#0=", lne 1, mn <module> 
print(abs(-1,-2)) 
TypeErmor abs() takes exactly one areument (2 given) 


如 果 传 入 的 参数 类 型 不 对 ， 也 会 出 现 TypeError 错误 ， 并 且 会 给 出 提示 。 例 如 ， 下 面 给 求 
绝对 值 的 函数 abs 提供 一 个 字符 串 参 数 : 


>>> prInttabs(ss)) 
Traceback (most Tecent call last): 
File "<pyshell#1>", me 1, mn <module> 
print(abs('ss')) 
TypeEIror bad operand type for abs(): str 


调用 函数 时 ， 参 数 个 数 不 对 时 ，Python 解释 器 会 自动 检测 出 来 ， 并 抛 出 TypeError 错误 。 
但 是 ， 如 果 参 数 类 型 错 了 ，Python 解释 占有 了 时 无 法 帮忙 检测 出 来 ， 例 如 下 面 的 函数 : 


def my abs(x): 
x: 
returmn x 
else: 
TetuI -Xx 
my_abs(1’) 


执行 程序 ， 没有 任何 报错 。 对 以 上 程序 进行 修改 ， 首 先 用 内 置 函 数 isinstance 判断 参数 的 类 
型 。 如 果 是 非 数 值 型 ， 则 提示 参数 类 型 错误 ， 代 码 如 下 : 


def my abs(x): 
if not 1snstance(x,(mt.float)): 
ralse TypeFrror(bad operand type') 
正式 
returmn X 
else: 
Ieturn -XxX 
my_abs(1’) 


执行 以 上 程序 ， 报 错 信息 如 下 : 
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Traceback (most Tecent call last): 
File "D:/pyproject/aretype function.py", line 8, in <module> 
my abs(1') 
File "D:/pyproject/aretype function.py", hmne 3, mn my abs 
Talse TypeEror( bad operand type’') 
TypeError: bad operand type 


【2 参数 传递 


在 Python 中， 所 有 参数 (变量 ) 都 按 引 用 传递 。 如 果 在 一 个 函数 中 修改 参数 ， 那 么 在 调用 这 
个 函数 的 函数 里 ， 原 始 参数 也 就 变 了 。 示 例 程序 如 下 : 


#1/usr/bin/python3 
gobal_ vall = "这 是 一 个 全 局 变量 "; 


#area 默认 参数 

def area(w.h.area=100): 
areaVal—w*h # 上 因数 内 是 局 部 变量 
print(global wall) 
return areaVal- 


W—4: 
| 一: 
print( Ww—" WwW,"h=" hh."area—".area(Ww.h)) 


def changeVal(mylist): 
# 修 改 值 
mylist.append([4.5.6)); 
print(" 疯 数 内 取 值 ".mylist) 
retum : 


# 调 用 

Imylist=[ 1.2.3| 
changeVal(mylist): 
print(" 函 数 外 取 值 ",mylist): 


# 匿 名 函数 
sum—lambda argl.are2:arel+are2: 
print(" 相 加 的 值 为 : ".Sum(1.2)): 


执行 以 上 程序 ， 输 出 结果 如 下 : 


这 是 一 个 全 局 变量 
w= 4I 5 area— 20 
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函数 内 取 值 [1. 2, 3, [4. 5, 6]] 
函数 外 取 值 [1. 2. 3. [4. 5, 6]] 
相 加 的 值 为 : 3 


6.2.1 不 可 变 类 型 参数 和 可 变 类 型 参数 
在 Python 中 ， 类 型 属于 对 象 ， 变 量 是 没有 类 型 的 。 例 如 : 


a=[1.2.3] 
a="Runoob" 


在 这 里 ，[1,2,3] 是 列表 类 型 ，"Runoob" 是 字符 串 类 型 ， 而 变量 a 没有 类 型 ， 仅 仅 是 对 象 的 
引用 (指针 )， 可 以 指 同 列表 对 象 ， 也 可 以 指 问 字符 串 对 象 。 
在 Python 中， 字符 串 、 元 组 和 数字 是 不 可 变 类 型 ， 而 列表 ,字典 等 则 是 可 以 修改 的 可 变 
e 不 可 变 类 型 . 进行 变量 赋值 a=5 后 ， 再 赋值 a=10， 这 实际 上 会 新 生成 mt 对象 10， 再 
让 a 指 问 它 ， 而 5 被 丢弃 ， 这 不 是 改变 a 的 值 ， 而 相当 于 新 生成 了 a。 
e 可 变 类 型 : 进行 变量 赋值 la=[1,2,3,4] 后 ， 再 赋值 la[2]=5， 这 会 更 改 列表 对 象 la 的 第 三 
个 元 素 ，]la 本 号 没 变 ， 只 是 内 部 的 一 部 分 值 被 修改 了 。 
使 用 这 两 种 类 型 的 对 象 作 为 函数 的 参数 时 ， 效 果 是 不 一 样 的 ， 区 别 如 下 。 
e 不 可 变 类 型 : 类 似 于 C++ 的 值 传递 ， 如 整数 、 字 符 串 、 元 组 。 例 如 fun(a)， 传 递 的 只 是 
a 的 值 ， 不 影响 a 本 身 。 又 如 , 在 fun(a) 内 部 修改 a 的 值 ， 只 是 修改 另 一 个 复制 的 对 象 ， 
不 会 影响 a 本身。 
e 可 变 类 型 : 类似 于 C++ 的 引用 传递 ， 如 列表 、 字 典 。 例 如 fun(la)， 则 是 将 la 真正 传 过 
去 ， 修 改 后 ，fun 外 部 的 la 也 会 受到 影 啊 。 
Python 中 的 一 切 都 是 对 象 ， 从 严格 意义 上 不 能 说 是 值 传 递 还 是 引用 传递 ， 应 该 说 传 不 可 变 
对 象 和 传 可 变 对 象 。 
当 传 不 可 变 对 象 为 函数 参数 时 ， 示 例如 下 : 
def ChangeInt(a): 
a= 10 
2 
ChangeInt(b) 
print(bb) ”# 结果 是 2 
上 述 示例 中 有 int 对 象 2， 指 回 它 的 变量 是 b， 在 传递 给 ChangeInt 函数 时 ， 按 传 值 方式 复 
制 了 变量 b，a 和 b 都 指向 同一 个 mt 对 象 ， 在 a=10 时 ， 则 新 生成 一 个 int 对 象 10， 并 让 a 指 
问 它 。 
当 传 可 变 对 象 为 函数 参数 时 ， 可 变 对 象 在 函数 里 修改 了 参数 ， 那 么 在 调用 这 个 函数 的 函数 
里 ， 原 始 参 数 也 变 了 。 例 如 : 
def changeme(mylist): 
# 修 改 传 入 的 列表 
mylist.append([1.2,3,4D) 


We 


print ("函数 内 取 值 : ", mylist) 
retum 
# 调用 changeme 函数 
mylist = [10.20.30] 
changeme(mylist) 
print ("函数 外 取 值 : ", mylist) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


函数 内 取 值 : [10. 20. 30, [1. 2. 3, 4]] 
函数 外 取 值 : [10., 20. 30, [1. 2. 3, 4]] 


从 输出 结果 可 以 看 出 ， 传 入 函数 的 和 在 末尾 添加 新 内 容 的 对 象 用 的 是 同一 个 引用 。 
6.2.2 ”参数 形式 


调用 函数 时 可 使 用 的 正式 参数 类 型 : 
e 关键 字 参 数 

e 默认 参数 

e 不 定 长 参数 


1. 必需 参数 
必需 参数 必须 以 正确 的 顺序 传 入 函数 。 调 用 时 的 数量 必须 和 声明 时 的 一 样 。 


例如 以 下 示例 中 ， 调 用 printme 函数 时 ， 必 须 传 入 一 个 参数 ， 不 然 会 出 现 语 法 错误 : 


def printme( str ): 
"打印 任何 传 入 的 字符 串 " 
print (str) 
retum 
# 调 用 printme 函数 
执行 以 上 程序 ， 输 出 结果 如 下 : 
Traceback (most recent call last): 
File “test.py", Ime 10, m <module> 
printme() 


TypeEror printme() mssing 1 required positional areument: 'str 


2. 关键 字 参 数 


关键 字 参 数 和 函数 调用 关系 紧密 ， 函 数 调 用 使 用 关键 字 参 数 来 确定 传 入 的 参数 值 。 使 用 关 


键 字 参数 允许 图 数 调用 时 参数 的 顺序 与 声明 时 的 不 一 致 , 因为 Python 解释 玲 能 够 用 参数 名 匹配 


参数 值 。 


以 下 示例 在 调用 函数 printme0 时 使 用 参数 名 : 


118 


第 6 章 函 数 


detpnntmel str ): 

"打印 任何 传 入 的 字符 串 " 
print(str) 

retum 

# 调 用 printme 函数 
printme(str = "菜鸟 教程" 


执行 以 上 程序 ， 输 出 结果 如 下 : 
菜鸟 教程 
以 下 示例 中 演示 了 函数 参数 的 使 用 不 需要 按照 指定 顺序 : 


detfprnntmto(name. age ): 
"打印 任何 传 入 的 字符 串 " 
Print(" 名 字 : ", name) 

print(" 年 龄 : ", age) 

retum 

# 调 用 printinfo 函数 
printinfo(age=$0, name="runoob") 


执行 以 上 程序 ， 输 出 结果 如 下 : 


名 字 : runoob 
年 龄 : 50 


3. 默认 参数 


调用 函数 时 ， 如 果 没 有 传递 参数 ， 则 会 使 用 默认 参数 。 以 下 示例 中 如 果 没 有 传 入 age 参数 ， 
则 使 用 默认 值 : 


def printinfo(name, age = 35): 
"打印 任何 传 入 的 字符 串 " 

print ("名 字 : ", name) 

print ("年 龄 : ", age) 

Tetum 

# 调 用 printinfo 函数 
prmntmtolage=50.name= Tunoob ) 
和 
printinfo(name="runoob") 


执行 以 上 程序 ， 输 出 结果 如 下 : 


名 字 : runoob 
年 龄 : 50 


名 字 : runoob 
年 龄 : 35 
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4. 不 定 长 参数 


实际 开发 中 ， 有 了 时 需要 函数 能 处 理 的 参数 比 当 初 声 明 时 更 多 。 这 些 参数 叫 作 不 定 长 参数 ， 
和 上 述 几 种 参数 不 同 ， 不 定 长 参数 在 声明 时 不 会 命名 。 基 本 语法 如 下 : 


def fnctionname([formal args.| *var ares tuple ): 
"函数 文档 字符 串 " 
function suite 
Tetum [expression| 


加 了 星 号 * 的 参数 会 以 元 组 的 形式 导入 ， 存 放 所 有 未 命名 的 变量 参数 。 例 如 : 


def printinto(arel, “wartuple): 
"打印 任何 传 入 的 参数 " 
print(" 输 出 : ") 

prnt(arg1) 

print(vartuple) 

# 调用 printinfo 函数 
printinfo(70, 60, $0) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


输出 : 
70 
(60. 50) 


如 果 在 调用 函数 时 没有 指定 参数 ， 它 就 是 一 个 空 元 组 。 我 们 也 可 以 不 回 函 数 传递 未 命名 的 
变量 。 例 如 : 


def printinto(argl1, “wartuple ): 
"打印 任何 传 入 的 参数 " 
print(" 输 出: ") 

print(argl) 

for var m vartuple: 

print(var) 

retum 

# 调用 printinfo 函数 
printinfo(10) 

printinfo(70., 60. $0) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


输出 : 
10 
输出 : 
10U 
6U 
$0 
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还 有 一 种 情况 就 是 参数 市 两 个 星 号 六 ， 基 本 语法 如 下 : 


def functionnamel([formal args.| **var args dict ): 
"函数 文档 字符 串 " 
function suite 
Tetum [expression| 


加 了 两 个 星 号 ** 的 参数 会 以 字典 的 形式 导入 。 例 如 : 


def printinfto(arel, **wardict): 
"打印 任何 传 入 的 参数 " 
print(" 输 出 : ") 

prnt(arel) 

print(vardict) 

# 调用 printinfo 函数 
printinto(1, a=2.,b=3) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
输出 : 
1 
fa: 2,'b" 3 
声明 函数 时 ， 参 数 中 的 星 号 * 可 以 单独 出 现 。 例 如 : 
def f(a,b,*.c): 
Tetum atbt+e 
单独 出 现 星 号 * 的 参数 必须 用 关键 字 传 入 。 例 如 : 


>>> def fla.b,*,c): 
return aHbrHc 


>>> 人 1,2,3)  # 报错 
Traceback(most recent call last): 
File "<stdm>", Ime 1. mn <module> 
TypeErmor f() takes 2 positional areuments but 3 were given 
>>> 人 1,2.c=3)# 正常 
6 


返回 值 


函数 可 以 返回 单一 值 ， 也 可 以 返回 多 个 值 。 函 数 返 回 值 主要 通过 return 语句 实现 。 
6.3.1 return 语句 


“Tetum [表达 式 ] ”语句 用 于 退出 函数 ， 并 选择 性 地 同调 用 方 返 回 一 个 表达 式 。 不 市 表达 式 
的 retum 语句 返回 None。 之 前 的 例 于 都 没有 示范 如 何 返 回 数 值 ， 以 下 示例 演示 了 ITetum 语句 的 
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def sum(arel, are2): 

# 返回 两 个 参数 的 和 " 
total = argl + arg2 
print(" 函 数 内 : ", total) 
retum total 

# 调用 sum 函数 
total = sum(10. 20) 
print(" 困 数 外 : ", total) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


函数 内 : 30 
函数 外 : 30 


6.3.2 ”返回 多 个 值 


函数 可 以 返回 多 个 值 。 例 如 ， 定 义 函 数 quadratic(a, b,c)， 它 接收 3 个 参数 ， 返 回 一 元 二 次 
方程 : aw +bx+c=0 的 两 个 解 ， 程 序 代码 如 下 : 


def quadratic(a,b.,c): 
d=b**2-4*a*c 
d=0: 
return print(" 次 方程 无 解 ") 
Xl] =(-b+math.sqrt(d))/(2*a) 
x2 =(-b-math.sqrt(d))/(2*a) 
retum Xl .x2 
a.b = quadratic(2, 3, 1) 
print(a.b) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
-0.5 -1.0 


注意 ， 虽 然 看 着 像 返 回 了 两 个 值 a 和 b， 但 其 实 Python 函数 返回 的 仍然 是 单一 值 。 在 交互 
式 命令 行 下 测试 : 

>>>T = quadratic(2.3,1) 

>>> print() 

(-0.5, -1.0) 

输出 的 返回 值 是 一 个 元 组 ， 但 是 在 语法 上 ， 返 回 一 个 元 组 时 可 以 省 略 圆 括号 ， 而 多 个 变量 
可 以 同时 接收 一 个 元 组 ， 按 位 置 赋 给 对 应 的 值 。 所 以 ,函数 返回 多 个 值 其 实 就 是 返回 一 个 元 组 ， 
但 写 起 来 更 方便 。 


122 


第 6 章 函 数 


Python 中， 程序 中 的 变量 并 不 是 在 哪个 位 置 都 可 以 访问 的 ， 访 问 权 限 决 定 于 变量 是 在 哪里 
赋值 的 。 
变量 的 作用 域 决定 了 在 哪 一 部 分 程序 可 以 访问 哪个 特定 的 变量 。Python 的 作用 域 一 共有 4 
分 别 如 下 。 
e L(Local): 局 部 作用 域 。 
e E(Enclosing): 般 套 作用 域 。 
e G(GlobaD): 全 局 作用 域 。 
e B(Built-in): 内 建 作用 域 。 
以 L 一 E 一 G 一 B 的 规则 查找 , 在 局 部 作用 域 找 不 到 , 就 去 局 部 作用 域外 的 局 部 作用 域 找 ( 例 
如 闭 包 )， 再 找 不 到 ， 就 去 全 局 作用 域 找 ， 最 后 去 内 建 作用 域 找 。 


种 


二 


X=int(2.9) # 内 建 作 用 域 

g count=0 # 全 局 作用 域 

def outer(): 
o_count=1  ”# 闭 包 函数 外 的 函数 
def Inner(): 


i count=2# 局 部 作用 域 


Python 中 ， 只 有 模块 (module)、 类 (class) 以 及 函数 (def、lambda) 才 会 引入 新 的 作用 域 ， 其 他 
的 代码 块 ( 如 if/elif/else/、try/except、for/while 等 ) 不 会 引入 新 的 作用 域 。 也 就 是 说 ， 在 这 些 语句 
内 定义 的 变量 ， 在 外 部 也 可 以 访问 ， 示 例如 下 : 


>>> 1 Trmue: 
.. msg = Tam from Runoob 


-a 
Tam from Runoob' 

上 述 示例 中 ，msg 变量 定义 在 站 语句 块 中 ， 但 在 外 部 也 可 以 访问 。 

如 果 将 变量 msg 定义 在 函数 中 ， 则 它 就 是 局 部 变量 ， 在 外 部 不 能 访问 : 


>>> def test(): 
mse nner= Tam from Runoob' 


>>> Insg nner 
Traceback (most recent call last): 
File “<stdm>", Ime 1. im <module> 
NameE1ror: name 'mse inner 1s not defined 
从 报错 的 信息 上 看 ， 说 明 msg_inner 未 定义 ， 无 法 使 用 ， 因 为 它 是 局 部 变量 ， 仅 在 函数 内 
可 以 使 用 。 
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6.4.1 全 局 变量 和 局 部 变量 


定义 在 函数 内 部 的 变量 拥有 局 部 作用 域 ， 定 义 在 函数 外 部 的 变量 拥有 全 局 作用 域 。 
局 部 变量 只 能 在 声明 它 的 函数 内 部 访问 ， 而 全 局 变量 可 以 在 整个 程序 范围 内 访问 。 


数 时 ， 在 函数 内 部 声明 的 所 有 变量 都 将 被 加 入 函数 的 作用 域 中 。 例 如 : 


total =0 # 这 是 一 个 全 局 变量 

# 可 与 函数 说 明 

def sum(arel, are2): 

# 返 回 两 个 参数 的 和 " 

total 二 argl +are2  #total 在 这 里 是 局 部 变量 
print(" 函 数 内 是 局 部 变量 :",total) 

Tetum total 

# 调 用 sum 函数 

sum(10, 20) 

print(" 函 数 外 是 全 局 变量 :".total) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


函数 内 是 局 部 变量 : 30 
函数 外 是 全 局 变量 : 0 


6.4.2 ” global 和 nonlocal 关键 字 


当 内 部 作用 域 想 修 改 外 部 作用 域 的 变量 时 ， 就 要 用 到 global 和 nonlocal 关键 字 了 。 


以 下 示例 会 修改 全 局 变量 nom: 


num= 1 

def fun1(): 

global num ” # 需要 使 用 global 关键 字 来 声明 
pnnttnunD) 

num= 123 

print num) 

fml() 

pnnttnunD) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

1 


123 
123 


如 末 要 修改 代 套 作用 域 中 的 变量 ， 则 需要 使 用 nonlocal 关键 字 ， 示 例如 下 : 


def outer(): 

num= 10 

Be 

nonlocal num # 使 nonlocal 关键 字 进 行 声 明 
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num= 100 
print(num) 
inner) 
prntnum) 
outer( ) 


执行 以 上 程序 ， 输 出 结果 如 下 : 

100 

100 

还 有 一 种 特殊 情况 ， 假 设 执行 下 面 这 段 代 码 : 


a=10 
def test(): 
a 一 8 十 ] 
print(a) 
test() 


执行 以 上 程序 ， 报 错 信息 如 下 : 


Traceback (most recent call last): 
File “test.py", me 7. In <module= 


test() 
File “test.py", lIne $5, m test 
a=a 二 +] 


UnboundLocalError: local variable 'a' referenced before assienment 

错误 信息 为 局 部 作用 域 引用 错误 ， 因 为 test 函数 中 的 变量 a 使 用 的 是 局 部 作用 域 , 未 定义 ， 
无 法 修改 。 

修改 a 为 全 局 变量 ， 作 为 函数 参数 传递 ， 使 程序 可 以 正 币 执行 : 

a=10 

def test(a): 

8 一 3a 十 ] 

print(a) 

test(a) 


执行 程序 ， 输 出 结果 如 下 : 


1 


[| 医 名 函数 (ambda) 


Python 使 用 lambda 来 创建 匿名 函数 。 
所 谓 匿名 ， 意 即 不 再 使 用 def 语句 这 样 的 标准 形式 来 定义 函数 。 


| 
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lambda 只 是 一 个 表达 式 ， 函 数 体 简单 很 多 。 

lambda 的 主体 是 一 个 表达 式 ， 而 不 是 一 个 代码 块 。 仅 仅 能 在 lambda 表达 式 中 封装 有 限 的 

匿名 函数 拥有 上 自己 的 名 称 空 间 ， 且 不 能 访问 上 自己 参数 列表 之 外 或 全 局 名 称 空间 里 的 参数 。 

虽然 匿名 函数 看 起 来 只 能 写 一 行 ， 但 却 不 等 同 于 C 或 C++ 的 内 联 函数 ， 后 者 的 目的 是 调用 
小 函数 时 不 占用 栈 内 存 ， 从 而 提高 运行 效率 。 

匿名 函数 的 语法 如 下 ， 只 包含 一 条 语句 : 

lambda [argl Larg2.…-argD]]:expression 

示例 如 下 : 

sum = lambda argl. arg2: argl + arg2 

# 调用 sum 函数 


prnt(" 相 加 后 的 值 为 :", sum(10., 20)) 
prnt(" 相 加 后 的 值 为 :", sum(20. 20)) 


执行 程序 ， 输 出 结果 如 下 : 


相 加 后 的 值 为 : 30 
相 加 后 的 值 为 : 40 


Collatz 序列 


前 面 介绍 了 如 何 使 用 Python 语言 创建 图 数 ， 如 何 回 函数 传递 参数 ， 不 可 变 类 型 参数 和 可 变 
类 型 参数 的 工作 原理 , 函数 中 用 到 的 变量 的 作用 域 , 以 及 函数 如 何 将 处 理 结果 返回 给 调用 程序 。 

本 节 将 研究 所 谓 的 “Collatz 序列 ”， 它 有 时 也 被 称 为 “最 简单 的 、 不 可 能 的 数学 问题 ”。 

综合 以 上 所 学 ， 本 节 就 来 编写 一 个 名 为 collatz 的 函数 ， 它 有 一 个 名 为 number 的 参数 。 如 
果 这 个 参数 是 倡 数 ,那么 collatz 函数 就 打印 number/2, 并 返回 结果 。 如 果 这 个 参数 是 奇数 ,collatz 
函数 就 打印 并 返回 3*number +1。 

然后 编写 一 个 程序 ， 让 用 户 输入 一 个 整数 ， 并 不 断 对 这 个 整数 调用 collatz 函数 ， 直 到 该 函 
数 返 回 值 1。 令 人 惊奇 的 是 ， 这 个 序列 对 于 任何 整数 都 有 效 ， 利 用 这 个 序列 ， 述 早 会 得 到 11 即 
使 数学 家 也 不 能 确定 这 到 底 是 为 什么 。 

需要 注意 的 是 ， 在 实现 过 程 中 ， 一定 要 记得 将 input 函数 的 返回 值 用 int 函数 转 成 整数 ， 合 
则 它 会 是 一 个 字符 串 。 

如 果 number % 2 一 0， 整数 number 就 是 偶数 。 如 果 number % 2 一 1， 整数 number 就 是 
奇数 。 

编写 程序 如 下 : 
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def collatz(number): 
fnumber 一 1: 
retum 1 
elif number % 2 一 (0: 
Tetum number // 2 
elit number % 2 一 1: 
Tetum 3*number+ 1 
print(collatz(18)) 
print(collatz(17)) 


以 上 程序 没有 异常 捕获 代码 。 下 面 为 前 面 的 代码 添加 ty 和 except 语句 ， 检 测 用 户 是 否 输 
入 了 一 个 非 整 数 的 字符 串 。 正 常情 况 下 ，int 函数 在 传 入 一 个 非 整 数 的 字符 串 时 ， 会 产生 
ValueError 错误 ， 比 如 int(puppy”))。 在 except 子 句 中 ， 同 用 户 输出 一 条 信息 ， 告 诉 他 们 必须 输 
入 一 个 整数 。 程 序 如 下 : 


def collatz(number): 
if nmmber 一 1: 
retum 1 
elif number % 2 一 (0: 
numbers = number // 2 
print(numbers) 
collatz(numbers) 
elif number % 2 一 1: 
numbers = 3*number + 1 
print(numbers) 
collatz(numbers) 
try: 
number = int(input(" 请 输入 一 个 整数 -=:")) 
collatz(number) 
except ValueError: 
print(" 请 输入 一 个 整数 ") 


编写 完 程 序 后 ， 大 家 可 以 运行 程序 ， 输 入 一 个 整数 ， 执 行程 序 ， 碍 看 和 输出 结果 。 


本 章 小 结 


在 Python 编程 中 ,函数 是 用 来 封装 独立 功能 或 方法 的 最 佳 选择 。 本 节 详 细 介 绍 了 函数 的 创 
建 和 调用 。 函 数 在 使 用 过 程 中 ， 可 以 接收 外 部 传 来 的 参数 。 函 数 参 数 分 为 两 类 :一 类 是 不 可 变 
类 型 参数 ， 男 一 类 是 可 变 类 型 参数 。 在 函数 中 也 可 以 声明 变量 。 变 量 的 作用 域 有 局 部 作用 域 和 
全 局 作用 域 ， 局 部 变量 只 在 函数 内 生效 ， 和 而 全 局 变量 在 函数 外 也 可 以 使 用 。 函 数 执行 功能 代码 
块 后 ， 可 以 通过 retum 语 名 将 需要 的 数据 返回 给 调用 方 。 

除了 显 式 声明 的 函数 外 ，Python 还 允许 匿名 函数 的 存在 。 
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本 章 在 最 后 综合 运用 函数 的 基础 知识 实现 了 Collatz 序列 。 


思考 与 练习 


1. 编写 Python 函数 ， 计 算 所 传 入 字符 串 中 数字 、 字 母 、 空 格 以 及 其 他 字符 的 个 数 。 

2. 编写 Python 函数 ， 判 断 用 户 所 传 入 对 象 的 长 度 是 否 大 于 5。 

3. 编写 Python 函数 ， 检 查 元 素 是 否 是 空 的 。 

4. 编写 Python 函数 ,检查 所 传 入 列表 的 长 度 ， 夺 大 于 2， 保留 前 两 个 长 度 的 内 容 ， 并 将 新 
内 容 返 回 给 调用 方 。 

5. 编写 Python 函数 ， 找 出 奇数 索引 的 元 素 并 插入 新 的 列表 中 。 

6. 检查 传 入 的 每 个 字典 的 value 长 度 ， 如 果 大 于 2， 保 留 前 两 个 长 度 的 内 容 ， 并 将 新 内 容 
返回 给 调用 方 。 

7. 利用 递归 获取 斐 波 那 契 数 列 中 的 第 10 个 数 。 

8. 编写 装饰 器 ， 为 多 个 函数 加 上 认证 功能 (用 户 名 和 密码 来 源 于 文件 )， 要 求 登录 成 功 一 次 ， 
后 续 函 数 都 无 须 再 输入 用 户 名 和 密码 。 
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面 问 对 象 编程 (Object Oriented Prosramming，OOP) 的 思想 主要 针对 大 型 软件 设计 而 提出 ， 
使 得 软件 更 加 灵活 ,能够 很 好 地 文 持 代 码 复 用 和 设计 复 用 , 代码 具有 更 好 的 可 读 性 和 可 扩展 性 ， 
大 幅 降 低 了 软件 开发 的 难度 。 面 同 对 象 编程 的 一 个 关键 性 观念 是 将 数据 以 及 对 数据 的 操作 封装 
一 起 ， 组 成 一 个 相互 依存 、 不 可 分 割 的 整体 ， 即 对 象 ， 不 同 对 象 之 间 通 过 消 晨 机制 进行 通信 或 
同步 。 对 相同 类 型 的 对 象 进 行 分 类 、 抽 象 后 ， 得 出 共同 的 特征 ， 从 而 形成 “类 ”。 面 回 对 象 编 
程 的 关键 就 在 于 如 何 合理 地 定义 这 些 类 并 日 合理 组 织 多 个 类 之 间 的 关系 。 

Python 是 真正 面 问 对 象 的 高 级 动态 编程 语言 ， 完 全 文 持 面 回 对 象 的 基本 功能 ， 如 封装 、 继 
了 藉 、 多 态 以 及 对 基 类 方法 的 窗 新 或 重 写 。Python 中 对 象 的 概念 很 广泛 ，Python 中 的 一 切 内 容 都 
可 以 称 为 对 象 ， 函 数 也 是 对 象 。 创 建 类 时 使 用 变量 形式 表示 对 象 特征 的 成 员 称 为 数据 成 员 ， 用 
负数 形式 表示 对 象 行为 的 成 员 称 为 成 员 方 法 ， 数 据 成 员 和 成 员 方 法 统称 为 类 的 成 员 。 


本 章 的 学 习 目标 : 

掌握 类 的 定义 和 使 用 ; 

掌握 类 的 私有 成 员 和 公有 成 员 的 定义 和 使 用 ; 
掌握 数据 成 员 的 定义 和 使 用 ; 

掌握 使 用 方法 来 插 述 对 象 具 有 的 行为 ; 

掌握 属性 的 定义 和 使 用 ; 

掌握 类 的 封装 以 及 类 之 间 的 继承 、 多 态 ; 

了 解 类 的 专 有 方法 。 


面 问 对 象 概述 


Python 是 一 门面 问 对 象 编程 语言 ， 使 用 面 问 对 象 语言 编码 的 过 程 叫 作 面 问 对 象 编程 。 

面 问 对 象 编程 是 一 种 程序 设计 思想 ， 这 种 思想 把 对 象 作 为 程序 的 基本 单元 ， 对 象 包 合 数 气 
和 操作 数据 的 函数 。 

面 同 对 象 编程 把 计算 机 程序 视 为 一 组 对 象 的 集合 ， 每 个 对 象 部 可 以 接收 其 他 对 象 发 送 过 来 
的 消 忠 ， 并 处 理 这 些 消 息 ， 计 算 机 程序 的 执行 就 是 一 系列 消 轧 在 各 个 对 象 之 间 的 传递 。 


Python 晕 础 教程 


在 Python 中， 所 有 数据 类 型 者 被 视 为 对 象 ， 也 可 以 日 定义 对 象 。 目 定义 对 象 的 数据 类 型 束 
是 面 问 对 象 中 的 类 。 


7.1.1 面向 对 象 术 语 简介 


Python 从 设计 之 初 就 已 经 是 一 门面 同 对 象 的 语言 ， 正 因为 如 此 , 在 Python 中 创建 类 和 对 象 
是 很 容易 的 。 本 节 将 简要 介绍 Python 面 问 对 象 编程 。 

在 正式 介绍 面 问 对 象 编程 之 前 ， 先 介绍 面 癌 对象 编 程 中 的 一 些 术 语 ， 从 而 在 头脑 里 形成 基 
本 的 面 癌 对 象 概念 ， 这 样 有 助 于 接 下 来 的 Python 面向 对 象 编程 学 习 。 

面向 对 象 编程 中 的 基本 术语 如 下 。 

e 类 (Class): 用 来 描述 具有 相同 的 属性 和 方法 的 对 象 的 集合 。 类 定义 了 这 种 集合 中 每 个 对 
象 所 共有 的 属性 和 方法 。 对 象 是 类 的 实例 。 

e 类 变量 : 类 变量 在 整个 实例 化 的 对 象 中 是 公用 的 。 类 变量 定义 在 类 中 旦 在 函数 体 之 外 。 
类 变量 通常 不 作为 实例 变量 使 用 。 

e 数据 成 员 : 类 变量 或 实例 变量 用 于 处 理 类 及 实例 对 象 的 相关 数据 。 

e 方法 重 写 : 如 果 从 父 类 继承 的 方法 不 能 满足 子 类 的 需求 ， 可 以 对 其 进行 改写 ， 这 个 过 
程 叫 作 方法 覆盖 (Overide)， 也 称 为 方法 重 写 。 

e 局 部 变量 : 定义 在 方法 中 的 变量 ， 只 作用 于 当前 实例 的 类 。 

e 实例 变量 : 在 类 的 声明 中 ， 属 性 是 用 变量 来 表示 的 。 这 种 变量 就 称 为 实例 变量 ， 它 们 
虽然 在 类 声明 的 内 部 ， 但 却 在 类 的 其 他 成 员 方 法 之 外 声明 。 

e 继承 : 继承 就 是 用 派生 类 继承 基 类 的 字段 和 方法 。 继 承 也 允许 把 派生 类 对 象 作 为 基 类 
对 象 对 符 。 例 如 ， 有 这 样 一 种 设计 ，Dosg 类 派生 自 Animal 类 ， 这 模拟 的 是 “是 一 个 ” 
(is-a) 关 系 (例如 ， 狗 是 一 种 动物 )。 

e 实例 化 : 创建 类 的 实例 。 

e 对 象 : 通过 类 定义 的 数据 结构 实例 ， 对 象 包括 数据 成 员 ( 类 变量 和 实例 变量 ) 和 方法 。 

和 其 他 编程 语言 相 比 ，Python 在 尽 可 能 不 增加 新 的 语法 和 语义 的 情况 下 加 入 了 类 机 制 |。 

Python 中 的 类 提供 面 同 对 象 编程 的 所 有 基本 功能 : 类 的 继承 机 制 允 许多 个 基 类 ， 派生 类 可 

以 覆盖 基 类 中 的 任何 方法 ， 方 法 中 可 以 调用 基 类 中 的 同名 方法 ， 对 象 可 以 包含 任意 数量 和 类 型 
的 数据 。 


7.1.2 类 的 定义 
在 Python 语言 中 定义 类 的 语法 格式 如 下 : 


class ClassName: 
<statement-1> 


对 类 实例 化 之 后 ， 可 以 使 用 类 的 属性 。 实 际 上 ， 创 建 一 个 类 之 后 ， 就 可 以 通过 类 名 访问 其 
属性 。 示 例 代 码 如 下 : 
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class MyClass(object): 
i=123 
def f(self): 
return hello world" 
由 代码 片段 和 类 的 定义 可 以 看 到 ， 在 Python 中 定义 类 时 使 用 class 关键 字 ，class 后 面 紧 接 
着 是 类 名 ， 如 本 例 中 的 MyClass， 类 名 通常 是 大 写 开 头 的 单词 ， 紧 接着 是 “(objecb ”， 表 示 这 
个 类 是 从 哪个 类 继承 而 来 的 。 通 营 ， 如 果 没 有 合适 的 继承 类 ， 束 使 用 object 类 ， 这 是 所 有 类 最 
终 都 会 继承 的 类 。 类 包含 属性 (相当 于 函数 中 的 语句 ) 和 方法 (类 中 的 方法 大 体 可 以 理解 成 前 面 介 
绍 的 函数 )。 


注意 : 
在 类 中 定义 方法 的 形式 和 函数 差不多 ， 但 不 称 为 函数 ， 而 称 为 方法 。 方 法 的 调用 需要 绑 定 
到 特定 对 象 上 ， 而 函数 不 需要 。 后 面 将 会 逐步 介绍 方法 的 调用 方式 . 


7.1.3 ”类 的 使 用 


本 节 简 单 讲述 类 的 使 用 。 示 例 代码 如 下 : 


#1/usr/bm/python3 
#-*-codmg:UTF-8-*- 
class MyClass(object): 
1= 123 
def f(self): 
return hello world" 


use Class = MyClass() 
print( 调 用 类 的 属性 : "use class 
print( 调 用 类 的 方法 : ',use_class.f0) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


调用 类 的 属性 : 123 
调用 类 的 方法 : hello world 


由 代码 中 的 调用 方式 可 知 ， 类 的 使 用 比 函 数 调用 多 了 若干 操作 ， 调 用 类 时 需要 执行 如 下 
操作 : 


use class = MyClass() 


这 叫 作 类 的 实例 化 ， 即 创建 类 的 实例 。 此 处 得 到 的 是 use_class 变量 称 为 类 的 具体 对 象 。 表 
看 后 面 两 行 调用 : 


print( 调 用 类 的 属性 ，'use_ class 
print( 调 用 类 的 方法 : "use_classf0) 
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这 里 第 一 行 调用 中 的 use_class.i 用 于 调用 类 的 属性 ， 也 就 是 前 面 提 到 的 类 变量 。 第 二 行 调 
用 中 的 use_class.f0 用 于 调用 类 的 方法 。 
类 对 象 文 持 两 种 操作 : 属性 引用 和 实例 化 。 属 性 引用 的 标准 语法 如 下 : 


ob].name 
语法 中 的 obj 代表 类 对 象 ，name 代表 属性 。 
7.1.4 ”类 的 方法 


在 类 的 内 部 ， 使 用 def 关键 字 来 定义 方法 ， 与 一 般 的 函数 定义 不 同 ， 类 的 方法 必须 包含 参 
数 self， 且 为 第 一 个 参数 ，self 代表 的 是 类 的 实例 。 示 例 程序 如 下 : 


# 类 定义 
class people: 
# 定 义 基本 属性 
name=" 
apge=0 
# 定 义 私有 属性 ， 私 有 属性 在 类 的 外 部 无 法 直接 访问 
weleht=0 
# 定 义 构造 方法 
def mt (selfn,a.w): 
self.name =n 
self.age=a 
self. welight=Ww 
def speak!(self): 
print("%%s 说 : 我 %d 岁 。" %(self name,self.age)) 


# 实例 化 类 
p= people(runoob',10.30) 
Pp.speakO 


执行 以 上 程序 ， 输 出 结果 如 下 : 
minoob 说 : 我 10 罗 。 


在 以 上 示例 中 ， 在 类 中 定义 speak0 方 法 时 市 了 self 参数， 该 参数 在 方法 中 并 没有 被 调用 ， 
是 否 可 以 不 要 呢 ? 另外 ， 调 用 speak0) 方 法 时 没有 传递 参数 ， 这 是 否 表 示 参 数 可 以 传递 也 可 以 不 
传递 呢 ? 

在 类 中 定义 方法 的 要 求 : 在 类 中 定义 方法 时 ， 第 一 个 参数 必须 是 self。 除 第 一 个 参数 外 ， 
类 的 方法 和 普通 函数 没有 什么 区 别 ， 比 如 可 以 使 用 默认 参数 、 可 变 类 型 参数 、 关 键 字 参数 和 命 
名 关键 字 参 数 等 。 

在 类 中 调用 方法 的 要 求 : 要 调用 方法 ， 在 实例 变量 上 直接 调用 即 可 。 除 了 self 参数 不 用 传 
入 ， 其 他 参数 正常 传 入 。 
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深入 介绍 类 


前 面 介 绍 了 类 的 定义 和 使 用 ， 本 节 将 深入 介绍 类 的 相关 内 容 ， 如 类 的 构造 方法 ( 义 称 构造 函 
数 ) 和 访问 权限 控制 |。 


7.2.1 类 的 构造 方法 
从 以 上 示例 程序 中 可 以 看 到 ， 类 中 有 一 个 名 为 ”init 0 的 特殊 方法 (构造 方法 )， 该 方法 在 
对 类 实例 化 时 会 日 动 调用 ， 像 下 面 这 样 : 
def mt (selt.n,a.w): 
self name=n 
self.age=a 
self. weleht=w 
为 类 定义 了 __init 0 方法 后 ， 类 的 实例 化 操作 会 日 动 调用 _init_0 方 法。 以 下 实例 化 类 
MyClass， 对 应 的 ”init 0 方法 就 会 被 调用 : 


x= MyClass() 
当然 ， init 0 方法 可 以 有 和 参数， 参数 通过 ”imit 0 传递 到 类 的 实例 化 操作 上 。 例 如 : 


class Complex: 
def mt (selt realpart Imaepart): 
self.r = realpart 
self.1 = maepart 
x = Complex(3.0, -4.5) 
print(X.r, xD  # 输出 结果 : 3.0 -4.5 


需要 注意 的 是 ，self 代表 类 的 实例 而 非 类 。 类 的 方法 与 普通 函数 只 有 一 个 特殊 的 区 别 
它们 必须 有 额外 的 第 一 个 参数 名 称 ， 按 照 惯例 名 称 是 self。 例 如 : 


class Test: 
det prt(self): 
print(self) 
print(selt. class ) 


t= Test() 
LprtU 
执行 以 上 程序 ， 输 出 结果 如 下 : 


< mam .Testinstance at Ox100771878> 


mam .Test 
从 执行 结果 可 以 很 明显 地 看 出 ，self 代表 的 是 类 的 实例 ,代表 当前 对 象 的 地 址 ， 而 self.class 
则 指向 类 。 


二 


self 不 是 Python 关键 字 ， 把 它 换 成 runoob 也 是 可 以 正常 执行 的 。 例 如 : 


class Test 
def prt(runoob): 
print(runoob) 
print(rmunoob. class ) 


t= Test() 
t.prt() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


< mam .Testinstance at Ox100771878> 
mam .Test 


在 定义 类 时 ， 夺 不 显 式 地 定义 ”init 0 方法 ， 则 程序 默认 调用 无 参 的 ”init 0 方法 。 例如 ， 
以 下 两 段 代 人 码 的 使 用 效果 一 样 : 


#1/usr/binvpython3 
#-*-codine:UTF-8-*- 
# 程 序 一 
class DefaultInit(object): 
def mt (self): 
print( 类 实例 化 时 执行 我 ， 我 是 _init (0 方法 。) 
def show!(self): 
print( 我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 来 调用 。") 
test = DefaultInit() 
print( 类 实例 化 结束 ) 
test.show() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


类 实例 化 时 执行 我 ， 我 是 _init (0 方法 。 
类 实例 化 结束 
我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 来 调用 。 


另 一 段 代 码 如 下 : 


#1l/usr/bm/python3 
#-*-Codine:UTF-8-*- 


class DefaultImt(obyect): 
def show!(self): 
print( 我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 来 调用 。") 


test = DefaultInitO 


print( 类 实例 化 结束 ') 


test.show!() 


134 


第 7 章 面向 对 象 编程 


执行 以 上 程序 ， 输 出 结果 如 下 : 


类 实例 化 结束 

我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 来 调用 。 

由 上 面 两 段 代 码 的 输出 结果 可 以 看 到 ， 当 代码 中 定义 了 _init 0 方法 时 ， 实 例 化 类 时 会 调 
用 该 方法 ; 铬 没有 定义 _init 0 方法 ， 实例 化 类 时 也 不 会 报错 ， 此 时 调用 默认 的 ”init 0 方法 。 

在 Python 中 定义 类 时 吞没 有 定义 构造 方法 ， 则 在 实例 化 类 时 调用 默认 的 构造 方法 。 男 外 ， 
”init _ 0 方法 可 以 有 参数 ， 参 数 通 过 _init 0 传递 到 类 的 实例 化 操作 上 。 

既然 _init 0 方法 是 Python 中 的 构造 方法 ， 那 么 是 否 可 以 在 一 个 类 中 定义 多 个 构造 方法 
呢 ? 首先 来 看 下 面 的 3 段 代码 。 

程序 1: 


#1/usr/bin/python3 
#-*-codine:UlTF-8-*- 


class DefaultImt(object): 
def mrt (self): 
print( 我 是 不 带 参 数 的 _init _0 方 法”) 


DefaultInitO 
print( 类 实例 化 结束 '") 


运行 以 上 程序 ， 输 出 结果 如 下 : 


我 是 不 带 参数 的 _init 0 方法 
类 实例 化 结束 


程序 2: 


#1/usr/bin/python3 
#-*-codine:UTF-8-*- 


class DefaultImt(object): 
def 1mt (self): 
print( 我 是 不 带 参 数 的 _init _0 方 法) 


def mt (selfparam): 
print( 我 是 带 一 个 参数 的 ”init 0 方法 ， 参 数值 为 :'param) 


DefaultImit( hello') 
print( 类 实例 化 结束 ') 


执行 以 上 程序 ， 输 出 结果 如 下 : 


我 是 带 一 个 参数 的 _init 0 方法 ， 参 数值 为 ，hello 
类 实例 化 结束 
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由 执行 结果 可 以 看 出 ， 调 用 的 是 市 param 参数 的 构造 方法 。 夺 把 类 的 实例 化 语句 改 为 : 


DefaultInitO 
执行 结 果 如 下 : 


Traceback (most recent call last): 

Fle "D:/pyproject/chO Tproeram?2.py". Ine 11., m <module> 

DefaultImt() 

TypeEror: mit () mssme 1 required positional areument: param 
由 此 可 见 ， 实 例 化 类 时 只 能 调用 带 两 个 参数 的 构造 方法 ， 调 用 其 他 构造 方法 会 报错 。 
程序 3: 
#1/usr/bm/python3 
#-*-codmne:UTF-8-*- 


class DefaultInit(object): 
detf mt (selt.param): 
print( 我 是 带 一 个 参数 的 ”init 0 方法 ， 参 数值 为 :'.param) 


def 1mt (self): 
print( 我 是 不 带 参数 的 _init 0 方法 ) 


DefaultInitO 
print( 类 实例 化 结束 ) 


运行 以 上 程序 ， 执 行 结果 如 下 : 


我 是 不 带 参 数 的 _init 0 方法 
类 实例 化 结束 


由 此 可 见 ， 调 用 的 构造 方法 除了 self 参数 外 ， 没 有 其 他 参数 。 硅 把 类 的 实例 化 语句 改 为 : 


DefaultInit('hello') 
执行 结果 如 下 : 


Traceback(most recent call last): 
File "D:/pyproject/chO7prosram3.py", lne 11. m <module> 
DefaultInit(hello') 
TypeEror mt () takes 1 positional areument but 2 were glven 


或 改 为 如 下 调用 方式 : 
DefaultImit( hello'.world") 
执行 结果 如 下 : 


Traceback(imost Tecent call last): 
File "也 :pyprolectch07program3.pY". lne 11, m <module> 
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Deftaultmit(hello world ) 
TypeErmor mt (takes 1 positional areument but 3 Were glven 


由 此 可 见 ， 实 例 化 类 时 只 能 调用 带 一 个 参数 的 构造 方法 ， 调 用 其 他 构造 方法 会 报错 。 

由 以 上 示例 可 知 ， 在 一 个 类 中 可 以 定义 多 个 构造 方法 ， 在 实例 化 类 时 只 实例 化 最 后 的 构造 
方法 ， 后 面 的 构造 方法 会 覆盖 前 面 的 构造 方法 ， 并 且 需 要 根据 最 后 那个 构造 方法 的 形式 进行 实 
例 化 。 因 此 ， 一 个 类 中 最 好 只 定义 一 个 构造 方法 。 


7.2.2 ”类 的 访问 权限 

在 类 的 内 部 , 可 以 有 属性 和 方法 , 外 部 代码 可 以 通过 直接 调用 实例 变量 的 方法 来 操作 数据 ， 
这 样 就 隐藏 了 内 部 的 复杂 逻辑 。 但 是 ， 外 部 代码 还 是 可 以 自由 地 修改 实例 的 属性 ， 例 如 以 下 
示例 : 


#!/usr/bim/python3 
#-*-codine:UTF-8-*- 


class Student(object): 
def mt (self name,score): 
self.name = name 
self.score = score 


bart = Student(zth'.80) 


print(bart.score) 
bart.score = 80 


print(bart.score) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

SU 

80 

由 上 面 的 代码 片段 和 输出 结果 可 以 看 出 ， 在 类 中 定义 的 非 构 造 方法 可 以 调用 构造 方法 中 实 
例 变量 的 属性 ， 调 用 方式 为 self 实例 变量 的 属性 名 ， 如 代码 中 的 selfname 和 selfscore。 可 以 在 
类 的 外 部 修改 类 的 内 部 属性 。 

下 面 束 来 介绍 如 何 控制 类 的 访问 权限 。 

1. 私有 变量 

要 想 内 部 属性 不 被 外 部 访问 ， 可 以 在 属性 名 称 前 加 两 个 下 划 线 ( ” )。 在 Python 中 ， 实例 变 
量 名 如 果 以 ” 开头， 就 会 变 成 私有 变量 ， 只 有 内 部 可 以 访问 ， 外 部 不 能 访问 。 示 例如 下 : 

#1/usr/bmypython3 

#-*-codine:UlTF-8-*- 


class Student: 
def 1mt (self name.score): 


_ 


self. name = name 


selt. Score = score 
def get nformation(self): 
print(" 学 生 %s 的 分 数 为 : %s" % (self name .self Score)) 


person = Student(" 小 明 ","95") 
print(" 收 改 前 的 属性 名 : "person. score) ”# 和 在 类 的 外 部 访问 私有 属性 
执行 以 上 程序 ， 输 出 结果 如 下 : 


Traceback (most Tecent call last): 
File "也 :pyprolectch07prrvate pw. Ime 12. m <module> 
print(" 修 改 前 的 属性 名 : "person， score) ”# 寿 类 的 外 部 访问 私有 属性 
AttributeError: "Student object has no attnibute ” Score' 


从 运行 结果 可 以 看 出 ， 将 变量 定义 为 私有 变量 ， 可 以 确保 外 部 代码 不 能 随意 修改 对 象 内 部 


的 状态 。 这 样 通过 进行 访问 限制 ， 代 码 更 加 安全 。 


男 外 ， 奢 在 类 的 外 部 直接 修改 私有 变量 的 值 ， 则 不 会 影响 到 最 终 实例 (私有 ) 变 量 的 值 。 示 


例 程序 如 下 : 


#1/usr/bin/python3 
#-*-codine:UTF-8-*- 


class Student: 
def mt (selfname,score): 
self. name = name 
self. Score = score 
deft get mformation(self): 
print(" 学 生 %s 的 分 数 为 : %s" % (self name .self Score)) 


person = Student(" 小 明 "."95") 
person.get infonnation() 


person. score=0 # 修 改 私 有 变量 的 值 
print(" 修 改 后 的 属性 名 :",person.， score) ”# 此 处 访问 的 _score 是 上 一 行 修改 的 ”score， 相 当 于 类 变量 
person.get_information() # 修 改 后 并 不 会 影响 到 私有 变量 的 值 ( 伪 修 改 ) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
学 生 小 明 的 分 数 为 : 95 


修改 后 的 属性 名 : 0 
学 生 小 明 的 分 数 为 : 95 


2. 在 类 的 外 部 获取 私有 变量 
在 Python 中 ， 可 以 通过 为 类 增加 get_attrs0 方 法 来 获取 类 中 的 私有 变量 ，attrs 表示 属性 名 。 


示例 程序 如 下 : 


看 /usrybin/ipython3 
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#-*-codine:UTF-8-*- 


class Student: 
def 1mt (self.name,score): 
selt. name = name 
selt. Score = score 
def get mformation(self): 
print(" 学 生 %6s 的 分 数 为 : %s" % (self name ,self score)) 
def get score(self): # 定 义 get attrs 方法 
Tetum self. Score 


person = Student(" 小 明 "."95") 

print(" 修 改 前 的 属性 名 : ".person.get_score0) ”大通 过 get 实例 变量 名 的 方法 来 获取 私有 变量 的 值 

person.get infonnation() 

person. score=0 

print(" 修 改 后 的 属性 名 : "person。 score) 。”# 此 处 访问 的 _score 是 上 一 行 修改 的 _score, 相当 于 类 变量 
person.get infonnation() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


修改 前 的 属性 名 : 95 
学 生 小 明 的 分 数 为 :95 
修改 后 的 属性 名 : 0 
学 生 小 明 的 分 数 为 : 95 


由 此 可 见 ， 在 类 的 外 部 可 以 使 用 “实例 名 . 类 名 _ 变量 名 ”的 方法 获取 私有 变量 。 例 如 : 


#1/usr/bim/python3 
#-*-codine:UTF-8-*- 


class Student: 
def 1mt (self.name.,score): 
self. name = name 
self. Score = score 
def get mformation(self): 
print(" 学 生 %6s 的 分 数 为 : %s" % (self name ,self score)) 


person = Student(" 小 明 "."95") 

print(" 修 改 前 的 属性 名 : “person Student score) ”#0 通过 “实例 名 . 类 名 私有 变量 名 ”的 方法 来 访问 私 
# 有 变量 

person.get mformation() 


person._ score=0 # 修 改 私有 变量 的 值 


print(" 修 改 后 的 属性 名 : ",person. score) 
person.get infonnation() 


139 用 


执行 以 上 程序 ， 输 出 结果 如 下 : 


修改 前 的 属性 名 : 95 
学 生 小 明 的 分 数 为 : 95 
修改 后 的 属性 名 : 0 
学 生 小 明 的 分 数 为 : 95 


3. 从 外 部 修改 私有 变量 的 值 


可 以 为 Student 类 增加 get name0 和 get score0 这 样 的 方法 以 从 外 部 获取 姓名 和 分 数 ; 为 
Student 类 增加 set score0 方 法 以 从 外 部 修改 分 数 。 在 Python 中 ， 通 过 定义 私有 变量 和 对 应 的 
set 方法 可 以 帮助 做 参数 检查 ， 避 免 传 入 无 效 的 参数 ， 以 安全 地 修改 私有 变量 的 值 。 示 例 程 序 
如 下 : 


#1/usr/bin/python3 
#-*-codine:UTF-8-*- 


class Student: 
def 1mt (selfname.score): 
self. name = name 
self. score = score 
def set nformation(self): 
print(" 学 生 %s 的 分 数 为 : %s" % (self name ,self score)) 
def get score(self): 
return self. Score 
def set_score(self new_ score): # 通 过 set 实例 变量 名 的 方法 修改 实例 变量 的 值 


self. score = new score 


person = Student(" 小 明 "."95") 
print(" 修 改 前 的 属性 名 : "person_get scoreO) 大 是 过 get 实例 变量 名 的 方法 来 获取 私有 变量 的 值 (实例 变量 ) 
person.get infonnation() 


person.set score(0) # 通 过 set 实例 变量 名 的 方法 来 修改 私有 变量 的 值 (实例 变量 ) 
print(" 修 改 后 的 属性 名 : "person_get scoreg) 

person.get nfonnation() 

执行 以 上 程序 ， 输 出 结果 如 下 : 


修改 前 的 属性 名 : 95 

学 生 小 明 的 分 数 为 : 95 

修改 后 的 属性 名 : 0 

学 生 小 明 的 分 数 为 : 0 

在 Python 中 ， 通 过 定义 私有 变量 和 对 应 的 get 方法 也 可 以 帮助 我 们 做 参数 检查 ， 避 免 传 入 
无 效 的 参数 。 例 如 : 


#1/usr/bin/python3 
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#-*-codine:UTF-8-*- 


class Student: 
def _ Inlt (self.name.,score): 
self. name = name 
selt. score = score 
def get mtormation(self): 
print(" 学 生 %s 的 分 数 为 : %s" % (self name ,self Score)) 
def get score(self): 
Tetum self. Score 
def set_score(self new_ score): # 通 过 set 实例 变量 名 的 方法 修改 实例 变量 的 值 
1 0<=new score < 100: 
Sell score= new score 
else: 


print(" 输 入 的 分 数 错误 ") 
person 二 Student(" 小 明 "."95") 


print(" 修 改 前 的 属性 名 : ".person.get_score0 〇 ) 的 是 过 get 实例 变量 名 的 方法 来 获取 私有 变量 的 值 (实例 变量 ) 
person.get nformation() 


person.set score(-10) ”# 术 甬 过 set 实例 变量 名 的 方法 来 修改 私有 变量 的 值 (实例 变量 ) 
person.set score(10) 


print(" 收 改 后 的 属性 名 : "person.get_score0) 
person.get_mformation() 


执行 以 上 程序 ， 输 出 结果 如 下 : 
修改 前 的 属性 名 : 95 

学 生 小 明 的 分 数 为 ，95 
输入 的 分 数 错误 

修改 后 的 属性 名 : 10 

学 生 小 明 的 分 数 为 : 10 


需要 注意 的 是 ， 在 Python 中 ， 变 量 名 类 似 xxx 的， 也 就 是 以 双 下 划 线 开头 ， 并 且 以 双 
下 划 线 结尾 的 , 是 特殊 变量 。 特殊 变量 可 以 直接 访问 , 不 是 私有 变量 , 所 以 , 不 能 使 用 name 、 
”score ”这 样 的 变量 名 。 

有 上 时候， 可 以 看 到 以 一 个 下 划 线 开头 的 实例 变量 名 ， 比 如 name， 这 样 的 实例 变量 在 外 部 
是 可 以 访问 的 。 但 是 , 按照 约定 俗 成 的 规定 ， 当 看 到 这 样 的 变量 时 , 意思 束 是 ,“ 虽 然 可 以 访问 ， 
但 是 请 视 为 私有 变量 ， 不 要 随意 访问 ”。 

以 双 下 划 线 开头 的 实例 变量 是 不 是 一 定 不 能 从 外 部 访问 呢 ? 其 实 也 不 是 。 不 能 直接 访问 
_ name 是 因为 Python 解释 器 对 外 把 “name 变量 改 成 了 _ Student _ name， 上 所以， 仍然 可 以 通过 
_Student _ name 来 访问 _name 变量 。 但 是 强烈 建议 不 要 这 么 干 ， 因 为 不 同 版 本 的 Python 解释 
器 可 能 会 把 _name 改 成 不 同 的 变量 名 。 


141 


Python 晕 础 部 各 ~ 


4. 类 的 私有 方法 


除了 私有 变量 ， 类 也 有 私有 方法 。 类 的 私有 方法 也 是 以 两 个 下 划 线 开头 ， 从 而 声明 是 私有 
方法 ， 不 能 在 类 的 外 部 使 用 。 私 有 方法 的 调用 方式 为 self 方 法 名 。 示 例 程序 如 下 : 


#1/usr/bm/python3 
#-*-codine:UTF-8-*- 


class Student: 

def 1mt (self): 
pass 

def _ func(self): # 定 义 一 个 私有 方法 
print(" 这 是 私有 方法 ") 

def func(self): # 定 义 一 个 会 有 方法 
print(" 现 在 为 公有 方法 ， 接 下 来 调用 私有 方法 ") 
self. fme() 


student = StudentO 
print(" 通 过 调用 公有 方法 来 间接 调用 私有 方法 ") 
student func() 

执行 以 上 程序 ， 输 出 结果 如 下 : 

通过 调用 公有 方法 来 间接 调用 私有 方法 
现在 为 会 有 方法 ， 接 下 来 调用 私有 方法 

这 是 私有 方法 


5 封装 


家 里 的 电视 机 ， 从 开机 ， 浏 览 节目 ， 换 台 ， 再 到 关机 ， 我 们 不 需要 知道 电视 机 的 具体 工作 
细节 ， 只 需要 在 使 用 的 时 候 按 下 遥控 器 就 可 以 完成 操作 ， 这 就 是 功能 的 封装 。 

在 用 支付 宝 进行 付款 的 时 候 ， 只 需要 在 使 用 的 时 候 把 二 维 码 展示 给 收 款 方 或 是 扫 一 下 收 款 
方 提供 的 二 维 码 就 可 以 完成 支付 ， 不 需要 知道 支付 宝 的 支付 接口 ， 以 及 后 台 的 数据 处 理 能 
这 就 是 方法 的 封装 。 

生活 中 处 处 都 体现 了 封装 的 概念 。 封 装 不 是 单纯 意义 的 隐藏 。 封 装 数据 的 主要 原因 是 为 了 
保护 隐私 。 封 装 方法 的 主要 原因 是 为 了 隔离 复杂 度 。 

在 编程 语言 里 ， 对 外 提供 接口 ， 表 示 接口 的 函数 通常 称 为 接口 函数 。 

封装 分 为 两 个 层面: 

对 于 第 一 层面 的 封装 ,在 创建 类 和 对 象 时 ,分 别 创 建 两 者 的 名 称 空间 。 只 能 通过 类 名 加 “.” 
或 obj. 的 方式 访问 名 称 空间 里 面 的 名 称 。 

对 于 第 二 层面 的 封装 ， 在 类 中 把 某 些 属性 和 方法 隐藏 起 来 ， 或 者 定义 为 和 有 的 ， 只 在 类 的 
内 部 使 用 ， 在 类 的 外 部 无 法 访问 ， 或 者 留 下 少量 的 接口 (函数 ) 供 外 部 访问 。 
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但 无 论 是 哪 种 层面 的 封装 ， 都 要 对 外 提供 用 于 访问 内 部 隐藏 内 容 的 接口 。 
在 Python 中 ， 使 用 双 下 划 线 的 方式 隐藏 属性 (设置 成 私有 属性 )。 
在 Python 中 ， 隐 藏 类 的 属性 时 使 用 什么 办 法 呢 ? 首先 来 看 下 面 的 示例 : 
class Teacher: 
def imt (seltname.ape:cOUTSe) 
self name~name 
selt.age=age 
self.course=course 


def teach(self): 
print("%os 1s teachimg "oseltname) 


class Student: 
def Inlit (self name.,age,eroup): 
seltname=name 
self.ape=age 
self.group=group 


def study(self): 
print("%os 1s studyme"%oselt.name) 


用 定义 的 类 创建 老师 {1 和 学 生 s1: 


t 1=Teacher("alex" .28. python' ) 
sl=Student("jack",22,"eroup2") 


分 别 打印 老师 和 学 生 的 姓名 、 年 龄 等 特征 : 


print(t] name.tl.ape.tl.cOUTSe) 
print(sl.name,sl.age.sl.eroup) 


返回 如 下 信息 : 


alex 28 python 
Jack 22 group2 


调用 老师 的 教书 技能 和 学 生 的 学 习 技 能 : 


tl.teach() 
sl.study() 


alex ls teachme 
Jack 1s studyme 


把 这 两 个 类 中 的 一 些 属性 隐藏 起 来 后 ， 代 人 码 如 下 : 


class Teacher: 
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def mt (self .name,age,.course): 
selt. name—name 


self. age=age 
self. course=course 


def teach(self): 
print("%os 1s teachine"%oself. name) 


class Student: 
def mt (selt.name.,age,eroup): 
self. Dame=nae 
self. age 一 age 
self._ group=group 


def study(self): 
print("%os 1s studyme"®oselt. name) 
创建 老师 和 学 生 的 实例 : 


tl=Teacher("alex",28,"python") 
sl=Student("jack",22,"group2") 


再 用 与 前 面 一 样 的 方法 调用 老师 和 学 生 的 特征 : 
print(t] name,t].age.t] .course) 
print(sl.name,sl].age.s1.eroup) 

此 时 就 会 报错 ， 输 出 如 下 信息 : 


Traceback (most recent call last): 

File "E:/py_code/oob.py", lme 114, m <module> 

print(t] .name,tl.age.tl].course) 

AttrbuteError: "Leacher object has no attmbute ‘name 
再 调用 老师 的 教书 拉 能 和 学 生 的 学 习 技 能 : 
tl.teach() 
sl.study() 
返回 如 下 信息 : 


alex ls teachme 
Jack 1s studyme 


可 以 看 到 ， 隐 忠 属 性 后 ， 再 像 以 前 那样 访问 对 象 内 部 的 属性 ， 就 会 返回 属性 错误 ， 


怎么 办 才能 访问 内 部 属性 呢 ? 
下 面 来 查看 t 和 sl 的 名 称 空间 : 


print(t1. dict ) 


{ Teacher name':'alex',' Teacher age': 28,' Teacher course': 'python'} 
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print(sl. dhct ) 
{ Student name': ]ack, ”Student age': 22,' Student proup' 'group2'} 


可 以 看 到 t 和 sl 的 名 称 空间 完全 变 了 ,现在 访问 1 名 称 空间 里 的 名 称 , 可 以 看 到 什么 呢 ? 
print(tl. Teacher name) 


print(tl. Teacher age) 
print(tl. Teacher course) 


alex 
28 
python 


这 次 没有 报错 , 看 来 隐藏 属性 之 后 可 以 通过 类 名 属性 名 的 方式 来 访问 内 部 属性 的 值 , 在 
得 到 和 隐藏 属性 之 前 ， 直 接 查看 与 内 部 属性 一 样 的 值 。 

由 此 可 见 ，Python 对 于 这 样 的 隐藏 ， 有 以 下 特点 : 

。 类 中 定义 的 X 只 能 在 内 部 使 用 ， 如 setf_X 引用 的 就 是 变形 之 后 的 结果 。 

。 这 种 变形 其 实 正 是 针对 外 部 发 生 的 改变 ， 在 外 部 是 无 法 通过 访问 的 。 

事实 上 ，Python 对 于 这 一 层面 的 封装 ， 需 要 在 类 中 定义 函数 。 这 样 ， 被 隐藏 的 属性 在 外 部 
就 可 以 使 用 了 ， 而 且 这 种 形式 的 隐藏 并 没有 在 真正 意义 上 限制 从 外 部 直接 访问 属性 ， 知 道 了 类 
名 和 属性 名 后 ， 一 样 可 以 调用 类 的 隐藏 属性 。 

Python 并 不 会 真 的 阻止 开发 人 员 访 问 类 的 私有 属性 ， 模 块 也 遵循 这 种 约定 。 很 多 模块 都 有 
以 单 下 划 线 开头 的 方法 ， 此 时 使 用 以 下 方式 导入 模块 时 ; 


from module mport * 
这 些 方法 是 不 会 被 导入 的 ， 必 须 通过 以 下 方式 导入 这 种 类 型 的 模块 : 


from module _private module 


继承 与 多 态 


面向 对 象 编程 语言 的 一 个 主要 功能 就 是 “继承 ”。 继承 是 指 这 样 一 种 能 力 : 可 以 使 用 现 有 类 
的 所 有 功能 ， 并 且 在 无 须 重 新 编写 原 有 类 的 情况 下 对 这 些 功 能 进行 扩展 。 
类 ”。 继 承 的 过 程 ， 束 是 从 一 般 到 特殊 的 过 程 。 在 茶 些 面 问 对 象 编程 语言 中 ， 一 个 子 类 可 以 继承 
多 个 基 类 。 但 是 一 般 情 况 下 ， 一 个 于 类 只 能 有 一 个 基 类 ， 要 实现 多 重 继承 ， 可 以 通过 多 级 继承 
来 实现 。 继 承 概 念 的 实现 方式 主要 有 了 两 类 : 实现 继承 和 接口 继承 。 实 现 继承 是 指使 用 基 类 的 属 
性 和 方法 而 无 须 额外 编码 。 接 口 继承 是 指 仅 使 用 属性 和 方法 的 名 称 ， 但 是 子 类 必须 提供 实现 (村 
类 重 构 父 类 的 方法 )。 

在 考虑 使 用 继承 时 ， 有 一 点 需要 注意 ， 那 就 是 两 个 类 之 间 的 关系 应 该 是 “属于 ”关系 。 例 
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如 ，Employee 对 象 是 一 个 人 ，Manasger 对 象 也 是 一 个 人 ， 因 此 这 两 个 类 (Employee 和 Manager 
类 ) 都 可 以 继承 Person 类 。 但 是 ，Leg 类 却 不 能 继承 Person 类 。 

面 问 对 象 开 发 范式 大 致 为 以 下 几 个 阶段 : 划分 对 象 一 抽象 类 一 将 类 组 织 成 层次 化 结构 (继承 
和 合成 ) 一 用 类 与 实例 进行 设计 和 实现 。 
7.4.1 类 的 单 继承 

Python 同样 支持 类 的 继承 ， 如 果 一 种 编程 语言 不 文 持 继 承 ， 类 就 没有 什么 意义 。Python 派 
生 类 的 定义 方式 如 下 : 

class DerivedClassName(BaseClassName): 


<statement-1> 


=<statement-N> 


BaseClassName( 以 上 示例 中 的 基 类 名 ) 必 须 与 派生 类 定义 在 同一 个 作用 域内 。 除 了 类 ， 还 可 
以 使 用 表达 式 ， 基 类 定义 在 男 一 个 模块 中 时 这 一 点 非常 有 用 : 


class DerivedClassName(modname.BaseClassName): 
示例 如 下 : 
#1/usr/bin/python3 


#-*-codne:UTF-8-*- 


class Person(objecb: ”# 定义 一 个 父 类 
deftalk(self;  # 父 类 中 的 方法 
prnt("person ls talking....") 


class Chinese(Persom): ” # 定义 一 个 子 类 ， 继 承 于 Person 类 
def walk(self): # 在 子 类 中 定义 目 喘 的 方法 
print(1s walkneg...") 


c=Chmese() 
c.talk(O) # 调用 继承 的 Person 类 的 方法 
cwalk0 人 ## 调用 本 身 的 方法 
执行 以 上 程序 ， 输 出 结果 如 下 : 
person ls tallang.… 
1s Walkimsg... 
7.4.2 ”类 的 多 继承 
Python 同样 文 持 多 继承 ， 但 文 持 有 限 。 多 继承 的 类 定义 如 下 : 


class DerivedClassName(Basel. Base2. Base3): 
<statement-1> 
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=<statement-N> 


需要 注意 圆 括号 中 父 类 的 顺序 ， 寿 父 类 中 有 相同 的 方法 名 ， 但 在 子 类 中 使 用 时 未 指定 ， 则 
Python 从 左 至 右 搜 索 ， 即 方法 在 子 类 中 未 找到 时 ， 从 左 到 右 查 找 父 类 中 是 否 包 含 方法 。 示 例 程 
序 如 下 : 


#1/usr/bin/python3 
#-*-codine:UTF-8-*- 


class people: 
name 一“ 
apge=0 
weleht=0 
def mt (selfn,aw): 
self.name =n 
self.age =a 
self. Welght = W 
det speak(self): 
print("%%s 说 : 我 %d 岁 。" %(self.name.self.age)) 


# 单 继承 示例 
class student(people): 
grade =" 
def mt (seltn,a,w.e): 
# 调 用 父 类 的 构造 函数 
people. init (selfn.a,w) 
self.erade = g 
# 窗 写 父 类 的 方法 
def speak(self): 
print("%%s 说 : 我 %d 岁 了 ， 我 在 读 %d 年 级 "%%o(self name,self.age,self.erade)) 


# 为 一 个 类 
class speaker(): 
topic =" 
name=" 
def Int (self nt): 
self.name =n 
selt.topic =t 
det speak(self): 
print(" 我 叫 %s， 我 是 一 名 演说 家 ， 我 演讲 的 主题 是 %s"%6(selfname.selftopic)) 


# 多 重 继承 
class sample(speaker,student): 
Bn 
def mt (selfn,a,w.e,t): 
student. mt (seltn.a,w,e) 
speaker. 1mt (seltnb 
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test = Sample( "TIimnl" ,239.80.4 Python ) 
testspeak0O ”# 方 法 名 相同 ， 默 认 调用 的 是 在 图 括号 中 靠 前 的 那个 父 类 的 方法 


执行 以 上 程序 后 ， 输 出 结果 为 : 
我 叫 Tim， 我 是 一 名 演说 家 ， 我 演讲 的 主题 是 Python 


7.4.3 构造 函数 的 继承 


如 果 要 给 实例 传 参 ， 就 要 用 到 构造 函数 ， 那 么 构造 函数 该 如 何 继承 ? 同时 子 类 叉 如 何 定义 
目 己 的 属性 ? 

继承 类 的 构造 函数 的 写法 有 两 种 。 

e 经 典 类 的 写法 父 类 名 称 ， init 人 (self 参数 1 参数 2…) 

e 新 式 类 的 写法 : super( 子 类 ,self)， init (参数 1 参数 2…) 

示例 程序 如 下 : 


#1/usr/bin/python3 
#-*-codne:UTF-8-*- 


class Person(object): 
def mt (selt name, age): 
self.name = name 
selt.age = age 


self.weieht = "weleht 


detf talk(self): 
print("person ls talkine...") 


class Chmese(Person): 
def init (self name, age. laneuage): # 先 继承 ， 再 重 构 
# 继 承 父 类 的 构造 函数 ， 也 可 以 写成 : super(Chinese.sel. init (name.age) 
Person. mt (selt, name, age) 


selflaneuage 二 laneuage ”# 定义 类 本 身 的 属性 


def walk(self): 
print(1s walkineg...") 


class American(Person): 
pass 


c=Chmese(blgbere', 22. Chinese) 


如 果 只 是 简单 地 在 于 类 Chinese 中 定义 一 个 构造 函数 ， 其 实 就 是 在 重 构 。 这 样子 类 惑 不 能 
继承 父 类 的 属性 了 。 所 以 ， 在 定义 子 类 的 构造 函数 时 ， 要 先 继承 ， 再 构造 ， 这 样 就 能 获取 父 类 
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的 属性 了 。 

子 类 构造 函数 继承 父 类 构造 函数 的 过 程 为 :实例 化 对 象 一 调用 子 类 init 0 一 子 类 
init 0 继承 父 类 ”init 0 一 调用 父 类 init 0。 
7.4.4 ”万 法 重 写 

如 果 父 类 的 方法 的 功能 不 能 满足 需求 ， 可 以 在 子 类 中 重 写 父 类 的 方法 ， 例 如 下 面 的 talk0 
方法 ， 

#1/usr/binpython3 

#-*-codine:UTF-8-*- 


class Person(object): 


deft mt (self, name. age): 
seltname = name 
self age 三 age 
selt.weight = "weight 


def talk(self): 
print("person ls talkine...") 
class Chmese(Person): 


def Inlt (selt name, age, laneuape): 
Person. mt (self, name, age) 


selt.laneuage = laneuage 
print(self.name, seltage, selt.weight, self.laneuage) 


def talk(self: # 子 类 重 构 方法 
print('%os 1s speakine chimese' % selti.name) 


def walk(self): 
print(1s walkineg...") 

c=Chmese(blebere", 22,'Chimnese'’) 

c.talk() 

执行 以 上 程序 ， 输 出 结果 如 下 : 

blgberg 22 weleht Chinese 

blgbersg 1s speaking chinese 
7.4.5 ”继承 下 的 多 态 

继承 有 什么 好 处 ? 最 大 的 好 处 是 子 类 获得 了 父 类 的 全 部 属性 及 功能 。 例 如 ， 如 果 有 一 个 父 
类 People， 拥 有 方法 print_tile0; 子 类 Child 继承 了 父 类 People， 则 Child 类 就 可 以 直接 使 用 父 
类 的 print_title0 方 法 。 
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在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 某 个 子 类 ， 那 么 它 也 可 以 被 看 作 父 类 。 但 是 ， 
有 反 过 来 束 不 行 。 
继承 还 可 以 一 级 一 级 地 继承 下 来 ， 束 好 比 从 季节 到 苞 苞 再 到 儿子 这 样 的 关系 。 而 任何 类 ， 
最 终 都 可 以 追 漳 到 根 类 object, 这 些 继承 关系 看 上 去 就 像 一 株 倒 放 的 树 。 例如， 如 图 7-1 所 示 的 
| object 】 
( Animal 】 ( Plant 】 
[ Dog 】] ( Cat ] | Tree ) [ Flower | 


Po 


图 7-1 继承 树 
由 于 Animal 类 实现 了 run0 方 法 ， 因 此 ，Dog 和 Cat 类 作为 它 的 子 类 ， 什 么 事 也 没 干 ， 就 
自动 拥有 了 run0 方 法 : 
class Ammal(object): 


def run(self): 
prmnt("Anmal ls mmnme...") 


class Dog(Anlimal): 
Pass 


class Cat(Animal): 
pass 

dog = DogO 

dog.runO) 

cat = Cat() 

cat.run() 


运行 结果 如 下 : 
当然 ， 也 可 以 为 子 类 增加 一 些 方法 ， 比 如 Dog 类 : 


class Dog(Anlimal): 
def run(self): 
print Dog 1s mmme...' 
def eat(self): 
print ‘Eatng meat.... 


继承 的 男 一 个 好 处 在 于 方便 对 代码 进行 改进 。 无 论 是 Dog 还 是 Cat 对 象 ， 执行 mn0 方 法 的 
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时 候 ， 显 示 的 都 是 Animal is running...， 符 合 逻 辑 的 做 法 是 分 别 显示 Dog is mnning... 和 Cat is 
running...。 因 此 ， 对 Dog 和 Cat 类 做 如 下 改进 : 
class Dog(Animal): 
def run(self): 
prnt Dog 1s rnme...' 


class Cat(Animal): 
def run(self): 
print 'Cat 1s rannine...' 


再 次 执行 run0 方 法 ， 输 出 结果 如 下 : 

Dog ls mnmnmne... 

Cat ls rnnme... 

当 子 类 和 父 类 都 存在 相同 的 run0 方 法 时 ， 子 类 的 run0 方 法 会 履 靖 父 类 的 run0 方 法 ， 在 代 
码 运 行 的 时 候 ， 总 是 会 调用 子 类 的 rn0 方 法 。 这 样 就 获得 了 继承 的 第 三 个 好 处 ， 多 态 。 

要 理解 什么 是 多 态 ， 首 先 要 对 数据 类 型 绸 做 一 点 说 明 。 和 定义 一 个 类 的 时 候 ， 实 际 上 和 定义 了 
一 种 数据 类 型 。 定 义 的 数据 类 型 和 Python 目 市 的 数据 类 型 (比如 字符 串 、 列 表 、 了 字典 等 ) 没 什么 
两 样 : 


a=listO #a 是 列表 类 型 

b= Animal() #b 是 Animal 类 型 

c=DogO #c 是 Dog 类 型 

例如 ， 可 以 用 isinstance0 判 断 一 个 变量 是 否 是 某 种 类 型 ， 
>>> 1sInstance(a, list) 

True 

>>> lsinstancel(b. Animal) 

True 

>>> 1sInstance(c¢, Dog,) 

True 

看 来 a、b、c 确实 对 应 着 列表 、Animal、Dosg 这 3 种 类 型 。 但 是 ， 再 试 试 下 面 的 示例 : 
>>> 1sinstance(c, Animal) 

True 


看 来 c 不 仅仅 是 Dog, c 还 是 Animal ! 不 过 仔细 想 想 , 这 是 有 道理 的 , 因为 Dog 是 从 Animal 
继承 而 来 的 ， 当 创建 Dog 实例 c 时 ， 认 为 c 的 数据 类 型 是 Dog 没 错 ， 但 c 同时 是 Animal 也 没 
错 ，Dosg 本 来 就 是 Animal 的 一 种 。 

所 以 ， 在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 茶 个 子 类 ， 那 么 它 的 数据 类 型 也 可 以 被 
看 作 父 类 。 但 是 ， 反 过 来 就 不 行 : 

>>>b= Animal0 

>>> isinstance(b, Dog) 

False 
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Dog 可 以 看 成 Animal， 但 Animal 不 可 以 看 成 Dog。 
为 了 理解 多 态 市 来 的 好 处 ， 还 坝 要 编写 一 个 函数 ， 这 个 函数 接收 一 个 Animal 类 型 的 变量 : 
def rn twice(animal): 
animal.rmO) 
animal.rnmO 
当 传 入 Animal 的 实例 时 ，ron_twice0 就 打印 出 : 
>>> Un twice(AnimalO) 
Anmmal ls rmnnme... 
当 传 入 Dog 的 实例 时 ，mn_twice0 就 打印 出 : 
>>> IUD twice(Dog!()) 
Dog ls mnnmne... 
Dog ls Tunning.. 
当 传 入 Cat 的 实例 时 ，run twice0 束 打印 出 : 


>>> ITUD twice(CatO)) 


Cat ls TUnnIng.… 
Cat 1s rnnme... 
现在 定义 Tortoise 类 ， 它 也 从 Animal 类 派生 ， 代 码 如 下 : 
class Tortoise( Animal): 
def run(self): 


print "Tortoise 1s runnine slowly...' 
当 调用 run_twice0 时 ， 传 入 Tortoise 的 实例 ， 代 码 如 下 : 


>>> run twice(Tortolse()) 

Tortolse 1s runnine slowly... 

Tortolse 1s runninge slowly... 

可 以 发 现 ， 新 增 一 个 Animal 的 子 类 时 ， 不必 对 run twice0 做 任何 修改 。 实 际 上 ， 任 何 依赖 
Animal 作为 参数 的 函数 或 方法 都 可 以 不 加 修改 地 正常 运行 ， 原 因 就 在 于 多 态 。 

多 态 带 来 的 好 处 就 是 ， 当 需要 传 入 Dog、Cat、Tortoise… 时 ， 只 需要 接收 Animal 类 型 就 可 
以 了 ， 因 为 Dog、Cat、Tortoise… 都 是 Animal 类 型 ， 然 后 ， 按 照 Animal 类 型 进行 操作 即 可 。 
由 于 Animal 类 型 有 run0 方 法 ， 因 此 ， 传 入 的 任意 类 型 ， 只 要 是 Animal 及 其 子 类 ， 融 会 自动 调 
用 实际 类 型 的 run0 方 法 ， 这 融 是 多 态 的 本 质 合 义 。 

对 于 一 个 变量 ， 只 需要 知道 它 是 Animal 类 型 ,无须 确切 地 知道 它 的 子 类 型 ,就 可 以 放心 地 
调用 run0 方 法 ， 而 具体 调用 的 mn0 方 法 是 作用 在 Animal、Dog、Cat 还 是 Tortoise 对 象 上 ， 由 
运行 时 对 象 的 确切 类 型 决定 ， 这 就 是 多 态 真 止 的 威力 : 调用 方 只 管 调 用 ， 不 管 细节 ， 而 当 新 增 
一 个 Animal 的 于 类 时 ， 只 要 确保 run0 方 法 编写 正确 ， 不 用 管 原 来 的 代码 是 如 何 调用 的 。 这 融 
是 著名 的 “ 开 闭 ”原则 。 
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e 对 扩展 开放 : 允许 新 增 Animal 子 类 。 
e 对 修改 封闭 : 不 需要 修改 依赖 Animal 类 型 的 run_twice0 等 方法 。 


类 的 专 有 方法 


前 面 已 经 讲解 了 类 的 访问 权限 、 私 有 变量 和 私有 方法 ， 除 了 自 定义 私有 变量 和 方法 外 ， 
Python 类 还 可 以 定义 专 有 方法 。 专 有 方法 在 特殊 情况 下 或 使 用 特殊 语法 时 由 Python 调用 ， 而 不 
像 普通 方法 一 样 在 代码 中 直接 调用 。 

看 到 形 如 ”xxx 的 变量 名 或 函数 名 就 要 注意 ， 这 在 Python 中 是 有 特殊 用 途 的 。 对 于 
”init 0 方法 ， 我 们 知道 怎么 用 了 ，Python 的 类 中 有 许多 这 种 具有 特殊 用 途 的 方法 ， 可 以 帮助 
我 们 定制 类 。 下 面 介绍 这 种 特殊 类 型 的 函数 定制 类 的 方法 。 


1._ str 人 0 方法 
在 介绍 之 前 ， 先 定义 Student 类 ， 定 义 如 下 : 


#1/usr/bim/python3 
#-*-codine:UlTF-8-*- 
# 类 的 专 有 方法 


class Student(object): 
def 1mt (self .name): 


selfname=name 

print(Student(xiaoming’)) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

< main .StudentobjectatOx0274A450> 

执行 后 输出 的 是 一 堆 字 符 串 ， 一 般 人 看 不 懂 ， 没 什么 可 用 性 ， 也 不 好 看 。 怎 样 才能 让 输出 


的 结果 好 看 一 些 呢 ? 只 需要 定义 好 _str_ 0 方法， 返回 一 个 好 看 的 字符 串 就 可 以 了 。 重 新 定义 
上 面 的 示例 : 
#1/usr/bin/python3 


#-*-codine:UTF-8-*- 
# 类 的 专 有 方法 
class Student(object): 
def init (selfname): 


self name=—name 


def str (self): 
Tetum ' 学 生 名 称 ; %s'%%self name 
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print(Student(xiaoming’)) 
执行 以 上 程序 ， 输 出 结果 如 下 : 


由 执行 结果 可 以 看 到 ， 这 样 输出 的 结果 不 但 好 看 ， 而 且 正 是 我 们 想 要 的 。 
如 果 在 交互 模式 下 输入 : 
#1msr/bm/python3 


#-*-Codine:UTF-8-*- 
# 类 的 专 有 方法 


class Student(object): 
def Inlit (selfname): 


self name=—name 


#print(Student( xiaomine’)) 
s=Student(xiaomme,) 

prnt(s) 

执行 以 上 程序 ， 输 出 结果 如 下 : 

< mam .Student objectatOx0331A4530=> 


由 执行 结果 可 以 看 到 ， 输 出 的 结果 还 跟 之 前 一 样 ， 不 容易 识别 。 这 是 因为 ， 直 接 显示 变量 
调用 的 不 是 _sttr _0 而 是 _repr _ 0， 两 者 的 区 别 在 于 ，_stt 0 返回 用 户 看 到 的 字符 串 ， 而 
”Tepr 0 返回 的 程序 开发 人 员 看 到 的 字符 串 。 也 束 是 说 ，_ repr_ 0 是 为 调试 服务 的 。 

解决 的 办 法 是 再 次 定义 ”repr _ 0。 通常 ， str 0 和 ”repr 0 的 代码 是 一 样 的 ， 所 以 有 如 
下 简便 与 法 : 

#Wusrblinpython3 

#-*-cCodine:UTF-8-*- 

# 类 的 专 有 方法 

class Student(object): 

deft mt (selfname): 


self name—name 


def str (self): 
Tetum ' 学 生 名 称 ; %s'%%self name 


Tr = 
#print(Student(xiaoming’)) 


s=Student(xlaomme’) 
print(s) 
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执行 以 上 程序 ， 输 出 结果 如 下 : 
学 生 名 称 ; xiaoming 

可 以 看 到 ， 结 果 正 是 我 们 期 望 的 。 
2. _iter (方法 


如 果 想 要 将 一 个 类 用 于 for.in 循环 ， 类 似 元 组 或 列表 ， 就 必须 实现 iter 0 方法 。 该 方法 
返回 一 个 欠 代 对 象 ，Python 的 for 循环 会 不 断 调用 该 迭代 对 象 的 _next 0 方法 ， 获 得 循环 的 下 
一 个 值 ， 直 到 过 到 StopIteration 错误 时 退出 循环 。 

下 面 以 斐 波 那 契 数列 为 例 ， 写 一 个 可 以 作用 于 for 循环 的 Fib 类 : 


#1/usr/bm/python3 
#-*-Ccodine:UTF-8-*- 
# Iter 


class Fib(object): 
def Inlit (self): 
self.a,selfb=0,1  # 和 初 始 化 两 个 计数 器 a、b 


def iter (self): 
Tetum self # 实 例 本 身 就 是 迭代 对 象 ， 返 回 目 己 


def next (seflf)}: 
self.a.self b=selfb.self atself'b 其 十 算 下 一 个 值 
ifselfa>100000: ” 胡 妥 出 循环 的 条 件 
Talse Stoplteration():; 

Tetum selfa # 返 回 下 一 个 值 
# 下 面 我 们 把 Fib 实例 作用 于 for 循环 
for n in Fib(): 

print(n) 

执行 程序 ， 将 输出 斐 波 那 契 数列 : 


1955 


987 
1397 
23584 
4181 
67165 
10946 
L771l 
286357 
46368 
73025 


3. getitem _() 方 法 


Fib 实例 虽然 能 够 作用 于 for 循环 ， 和 列表 有 点 像 ， 但 是 不 能 将 它 当 成 列表 使 用 。 比 如 ， 获 
取 第 3 个 元 素 : 


#1/usr/bm/python3 
#-*-codine:UlTF-8-*- 
# iter 


class Fib(object): 
def 1mt (self): 
selfaselfb=0.1 ”# 初 始 化 两 个 计数 器 ab 


def iter (self): 
Tetum self # 实 例 化 本 号 就 是 达 代 对 象 ， 因 此 返回 自己 


(ef next {self)}: 
self.a.selfb=selfb,selfatselfb #w 十 算 下 一 个 值 
下 self.a>100000: ” 帮 娘 出 循环 的 条 件 
Talse StoplIteration(): 
return self.a # 返 回 下 一 个 值 
for n m Fib(Ol3: 
printn) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
Traceback (most recent call last): 
Flle” lter py", lme 17,m <module> 
for n m FibO[3|: 
TypeEiror: 'Fib' object does not support mdexmne 
由 执行 结果 可 以 看 到 , 获取 元 紊 时 报错 了 。 该 怎么 办 ? 要 想像 列表 一 样 按照 下 标 获取 元 素 ， 
需要 实现 ”getitem ”0 方法 ， 代 码 如 下 : 
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#1/usr/bm/python3 
#-*-Codine:UTF-8-*- 
# getitem 


class Fib(object): 
def getitem (selt.n): 
apbsll 
for x m range(n): 
ab—b.atb 
retum a 


下 面 尝 试 取得 裴 波 那 契 数列 的 值 : 
fib=Fib0 


prnt(fib[3)) 
prnt(fib[8]) 


执行 以 上 程序 ， 输 出 结果 如 下 : 

本 

34 

由 执行 结果 可 以 看 到 ， 可 以 成 功 获 取 对 应 数列 的 值 了 。 

4._getattr “() 方 法 

正常 情况 下 ， 调 用 类 的 方法 或 属性 时 ， 如 果 类 的 方法 或 属性 不 存在 ， 就 会 报错 。 比 如 定义 
Student 类 : 


#1l/usr/bm/python3 
#-*-codine:UTF-8-*- 
# getattr 


class Student(object): 
def Inlt (self.name): 
selt.name—xiaomineg’ 


对 于 上 面 的 代码 , 调用 name 属性 不 会 有 任何 问题 , 但 是 调用 不 存在 的 score 属性 就 会 报错 。 
执行 以 下 代码 : 
stu=Student( xlaomimne ) 


print(stu.name) 
print(stu.score) 


输出 结果 如 下 : 
xlaomine 
Traceback (most recent call last): 
File" getattr .pw lme 1],m <module> 
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print(stu.score) 
AttributeError: 'Student object has no attribute 'Score' 


由 输出 结果 可 以 看 到 ， 错 误 信 息 告诉 我 们 没有 找到 score 属性 。 对 于 这 种 情况 ， 该 怎么 解 
决 昵 ? 

要 避免 这 个 错误 ， 除 了 可 以 添加 score 属性 外 ，Python 还 提供 了 男 一 种 机 制 ， 就 是 编写 
”getattr _ 0 方法 以 动态 返回 一 个 属性 。 对 上 面 的 代码 做 如 下 修改 : 

#!/usr/bm/python3 


#-*-Codine:UTF-8-*- 
# getattr 


class Student(object): 
deft mt (seltname): 
self.name=xiaomimne 


def getattr (self.attr): 
if attt—'score': 
retum 9%6 


stu=Student('xiaomine’) 
print(stu.name) 
print(stu.score) 


当 调 用 不 存在 的 属性 (如 score) 时 , Python 解释 器 就 会 调用 ”getattt (self'score'”) 以 试 获取 
属性 ， 这 样 就 有 机 会 返回 score 属性 的 值 。 执 行 结果 如 下 : 

Xlaoming 

96 

由 输出 结果 可 以 看 到 ， 可 以 正确 输出 不 存在 的 属性 的 值 。 

注意 ， 只 有 在 没有 找到 属性 的 情况 下 才 调 用 ”getatt 0, 己 有 的 属性 (如 name) 不 需要 调用 
”getattr ”0 来 查找 。 


5 all 人 0 方法 


实例 可 以 有 目 己 的 属性 和 方法 ,调用 实例 的 方法 时 使 用 instance.method0。 能 不 能 直接 对 实 
例 本 号 进行 调用 ? 答案 是 能 。 

任何 类 ， 只 需要 定义 _call 0 方法 ， 就 可 以 直接 对 实例 进行 调用 ， 例 如 : 

#1/usr/bm/python3 

#-*-codine:UTF-8-*- 

# call 


class Student(object): 
def mt (self .name): 
self.name~—name 


158 


第 7 章 面向 对 象 编程 


def call (self): 
print( 名 称 : %os'%6self name) 


执行 如 下 操作 : 


stu=Student(xiaomine’) 
stu) 


执行 结果 如 下 : 
名 称 : Xiaoming 


由 输出 结果 可 以 看 到 ， 可 以 直接 对 实例 进行 调用 并 得 到 结果 。 

_ Call 0 还 可 以 定义 参数 。 对 实例 进行 直接 调用 就 像 函 数 调用 一 样 ， 完 全 可 以 把 对 象 看 成 

如 果 把 对 象 看 成 函数 ， 函 数 本 里 就 可 以 在 运行 期 间 动 态 创建 出 来 ， 因 为 类 的 实例 部 是 在 运 
行 期 间 创 建 出 来 的 。 

那么 ， 怎 么 判断 一 个 变量 是 对 象 还 是 函数 呢 ? 

很 多 时 候 ， 判 断 一 个 对 象 能 否 被 调用 ， 可 以 使 用 callable0 函 数 ， 比 如 前 面 定 义 的 高 有 
_call 0 的 类 实例 。 输 入 如 下 : 


print(callable(Student(xiaoqiang’)) 
print(callable(max)) 
print(callable([1.2.3])) 
print(callable(None)) 
print(callable('a')) 

执行 结果 如 下 : 


True 
True 
False 
False 
False 


由 输出 结果 可 以 看 到 ， 通 过 callable0 函 数 可 以 判断 一 个 对 象 是 否 为 可 调用 对 象 。 


本 章 实战 


前 面 介 绍 了 面 癌 对 象 的 概念 ， 以 及 在 Python 中 如 何 实现 面 回 对 象 编程 。 本 节 综 合 运 用 前 面 
所 学 ， 为 校园 系统 构建 校园 成 员 类 体系 ， 以 方便 对 学 校 人 员 进 行 管理 。 

对 于 学 校 中 的 所 有 人 员 , 可 以 抽象 出 SchoolMember 类 , 该 类 继承 于 object 类 .SchoolMember 
类 中 定义 了 一 些 学 校 成 员 的 公有 属性 和 方法 ， 比 如 ， 每 个 人 都 有 姓名 、 年 龄 、 性 别 等 ， 每 个 人 
进入 学 校 时 都 需要 注册 ; 每 个 人 都 可 以 告知 他 人 自己 的 个 人 信息 ; 男 外 ， 还 可 以 开除 人 员 。 

接着 , 可 以 将 学 校 成 员 细 分 为 老师 和 学 生 。 因 此 , 为 老师 声明 Teacher 类 , 为 学 生 声明 Student 
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类 。Teacher 和 Student 类 都 继承 日 学 校 成 员 类 SchoolMember。 

老师 负责 授课 ， 每 个 月 有 相应 的 工资 。 因 此 ，Teacher 类 有 新 资 (salarV) 和 课程 (course) 两 个 
属性 。 学 生 需 要 交 学 费 、 选 课 、 上 课 。 因 此 ，Student 类 有 学 费 (tuition)、 课 程 (course) 等 属性 ， 
文 付 学 费 的 动作 可 以 封装 成 方法 paytuition0。 

综合 以 上 分 析 ， 使 用 Python 面 癌 对象 编程 技术 进行 实现 ， 程 序 如 下 : 


class SchoolMember(objectb: 
"学 校 成 员 基 关 " 
member=0 


def 1mt (selt name., ape. sex): 
self.name = name 
self.age = ape 
self.sex = SEX 
self.enroll() 


def enroll(self): 
print(Just enrolled a new school member [%s].’ % selt.name) 
schoolMember.member += 1 


def tell(self): 
print(-—-%0s-——-" % selt.name) 
fork.vmself dict .tems(): 
print(k, v) 
print(----end--——-') 


def del (self): 
print( 开 除 [%6s] % selfname) 
SchoolMembermember = 1 


class Teacher(SchoolMember): 
教师 ' 
def Init (selt name, ape. sex, salary, course): 
SchoolMember. mit (selt. name. age, sex) 
selt.salary = salary 
self.course = course 


def teachme(self): 
print( Teacher [%os] 1s teachme [%%s] % (self.name. self.course)) 


class Student(SchoolMember): 
ee 忻 ' 
def mt (selt name, apge. sex, course, tution): 
SchoolMember， mit {self, name. age, sex) 
self.course = course 
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self.tuition = tuition 
self.amount = 0 


def pay tulton(selt amount): 
prmnt(student [%s| has just paid [9%os| % (self.name, amount)) 
self.amount += amount 


# 测 试 代码 

tl = Teacher( WusIr. 28, 'M', 3000, Python ) 
tl.tell() 

s] = Student(haitao', 38, 'M', 'python', 30000) 
s].tell() 

s2 = Student(lichuane’, 12, 'M. python', 11000) 
print(SchoolMember.member) 

del s2 


print(SchoolMember.member) 
执行 以 上 程序 ， 输 出 结果 如 下 : 


Just enrolled a new school member [haltao|. 
haitao—— 

age 38 

sex M 

name haltao 

amount 0 

course python 

tultlon 30000 

pm 

Just enrolled a new school member [lichuanel. 
3 

开除 [lichuang] 

2 

开除 [Wusir] 

开除 [haitao] 


本 章 小 结 


本 章 主要 讲解 了 Python 面向 对 象 编程 技术 。 本 章 首先 介绍 了 面 回 对 象 的 基本 概念 、 术 语 ， 
让 大 家 重 温 一 下 面 问 对 象 知识 ， 以 便 对 面 回 对 象 编程 技术 有 个 总 体 认 识 。 其 次 介绍 了 如 何 使 用 
Python 语言 来 定义 类 以 及 属性 、 方 法 ， 以 及 如 何 创建 和 访问 类 对 象 。 

接 独 深入 介绍 了 类 ， 包 括 类 的 构造 方法 、 类 的 访问 权限 ， 以 确保 面 问 对 象 编程 技术 中 信息 
的 安全 性 。 

然后 介绍 了 面 回 对 象 编程 技术 的 三 大 特性 : 封装 、 继 承 和 多 态 。Python 语言 中 ， 类 的 继承 
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有 单 继承 和 多 继承 两 种 方式 。 和 其 他 语言 一 样 ， 类 的 构造 函数 、 属 性 、 方 法 成 员 、 数 据 成 员 ， 
均 可 继承 ， 

除了 可 以 自 定义 类 的 方法 ， 类 本 身 还 有 一 些 专 有 方法 ， 这 些 方法 有 特殊 的 用 途 ， 但 允许 开 
发 人 员 进 行 定制 。 


思考 与 练习 


1. 简 述 面 问 对 象 编程 技术 的 三 大 特性 ， 它 们 各 有 什么 用 处 ， 说 说 你 的 理解 。 
2. 类 的 属性 和 对 象 的 属性 有 什么 区 别 ? 

3. 面向 过 程 编程 与 面 同 对 象 编程 的 区 别 与 应 用 场景 ? 

4. 类 和 对 象 在 内 存 中 是 如 何 保 存 的 ? 

5. 请 使 用 面 问 对 象 的 形式 优化 以 下 代码 : 


def excl(host.port.db.charset): 
conn—=connect(host.port.db.charset) 
conn.execute(sql) 
Ietum XXX 

def exc2(host.port.db.charset.proc name) 

conn—=connect(host.port.db.charset) 
conn.call proc(sql) 
Tetum XXX 


# 每 次 调用 都 需要 重复 传 入 一 堆 参 数 

excl1(127.0.0.1'.3306.'db]"','utf8','select * from tb]:") 

exc2(127.0.0.1',3306,'db1','ntf8",' 存 储 过 程 的 名 称 ") 
6. 运行 如 下 代码 ， 会 输出 什么 ? 


class People(object): 


_ name = "luffy" 
ape=]18 


pl = People() 
print(pl. name.,pl. age) 
7. 运行 如 下 代码 ， 会 输出 什么 ? 
class People(oblect): 
def mt (self): 
print(™ mt ") 
def new (cls,*ares, **kwares): 


print( ” new U ) 
retum object. new (cls, *args, **kwargs) 
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8. 简单 解释 Python 中 的 静态 方法 和 类 方法 ， 并 分 别 补 序 代码 后 执行 下 列 方法 。 


Class A(object): 


def foo(self. x): 
print("executing foo(9%0s. %0s)" % (self.x)) 


(Velassmethod 
det class foo(cls, x): 
print(“"executing class foo(®%os., %0s)" % (cls.x)) 
(Vstaticmethod 
det static foo(x): 
print("executine static foo(%os)" % (x)) 


a=A() 


9. 依据 多 重 继承 的 执行 顺序 ， 请 解答 以 下 程序 的 输出 结果 是 什么 ? 并 解释 。 


class A(object): 
def init (self): 
print(A') 
super(A, self). mt OQ) 


class B(object): 
def mt (self): 
print(B') 
super(B. self). mt OQ 


class C(A): 
def mt (self): 
print(C) 
super(C., self). mit () 


class D(A): 
def 1mt (self): 
prnt(D') 
super(D. self}). mit () 


class E(B. C): 
def mt (self): 
prat(E) 
super(E. self). mt () 


class F(C., B, D): 
def 1mt (self): 


E> 


print(F’) 
super(F, self). mt () 


class G(D, B): 
def 1mt (self): 
pnnt(G) 
suUper(G. se 由 Init 0 


g=G0 
mw 
10. 请 编写 一 个 小 游戏 一 一 人 狗 大 战 ， 有 两 个 角色 : 人 和 狗 。 游 戏 开始 后 ， 生 成 两 个 人 ， 
三 条 狗 ， 互 相 混 战 ， 人 被 狗 咬 了 会 挥 血 ， 狗 被 人 打 了 也 挥 血 ， 狗 和 人 的 攻击 力 以 及 有 具备 的 功能 
都 不 一 样 。 
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前 面 几 章 的 脚本 基本 上 都 是 用 Python 解释 右 编 写 的 ， 如 果 从 Python 解释 器 退出 再 进入 ， 
那么 定义 的 所 有 方法 和 变量 就 都 消失 了 。 

为 此 ，Python 提供 了 一 种 办 法 ， 可 以 把 这 些 定义 存放 在 文件 中 ， 供 一 些 脚本 或 交互 式 的 解 
释 句 实例 使 用 ， 这 种 文件 被 称 为 模块 。 

模块 是 一 种 包含 所 有 定义 的 函数 和 变量 的 文件 ， 后 级 名 是 py。 模 块 可 以 被 别 的 程序 引入 ， 
以 使 用 模块 中 的 函数 等 功能 。 这 也 是 使 用 Python 标准 库 的 方法 。 本 章 就 来 介绍 Python 模块 的 
定义 及 使 用 ， 以 及 Python 第 用 的 内 置 模块 。 


本 章 的 学 习 目 标 : 

e 了 了 解 Python 模块 的 概念 ; 

e 掌握 目 定 义 模块 的 方法 ; 

掌握 模块 的 导入 和 使 用 ; 

理解 Python 中 包 的 定义 、 导 入 和 组 织 ; 

了 解 Python 中 和 用 的 内 置 模块 ， 并 掌握 内 置 模块 的 使 用 方法 : 
熟悉 第 三 方 模块 的 下 载 、 安 装 和 使 用 。 


模块 


在 程序 中 定义 函数 可 以 实现 代码 重用 。 但 是 当代 码 这 渐变 得 庞大 时 ， 可 能 想 要 把 它 分 成 几 
个 文件 ， 以 便 维 护 更 简单 。 同 时 ， 我 们 希望 在 一 个 文件 中 写 入 的 代码 能 够 被 其 他 文件 重用 ， 这 
时 应 该 使 用 模块 。 

Python 中 的 模块 分 为 两 类 ， 一 类 是 内 置 模块 ( 义 称 标准 模块 )， 这 类 模块 在 安 疤 Python 后 目 
动 市 有 ; 男 一 类 是 用 户 晶 定义 模块 ， 由 开发 人 员 根 据 业 务实 际 需 求 编写 。 本 节 束 来 介绍 Python 
模块 。 


8.1.1 标准 模块 
Python 本 身 带 有 一 些 标准 模块 。 有 些 模块 直接 被 构建 在 解析 器 里 ， 这 些 虽然 不 是 Python 


语言 内 置 的 功能 ， 但 是 却 能 高 效 使 用 ， 甚 至 是 系统 级 调用 也 没 问题 

这 些 组 件 会 根据 不 同 的 操作 系统 进行 不 同形 式 的 配置 ， 比如 winreg 这 个 模块 就 只 会 提供 给 
Windows 系统 。 

Python 提供 了 一 个 十 分 特别 的 模块 sys， 内 置 在 每 一 个 Python 解析 器 中 。 下 面 是 一 个 使 用 
sys 模块 的 例子 。 


#1l/usr/bm/python3 
1mport SYS 


print( 命 令 行 参 数 如 下 ;) 
for 1 mn sys.arev: 
print() 
print(nmpPython 路 径 为 :', sys.path, "\n') 
执行 过 程 如 下 : 


D:\pyproject=python3 chO8standardlib.py argl arg2 
命令 行 参数 如 下 : 

chO8standardhb.py 

argl 

are2 


Python 路 径 为 : [D:\pyproject, 'C:\Program Files\Python37\python37.zip', 'C:\Proeram Files\Python3\DLLs,', 
'C:\Program Files\Python3 lb’, ‘C:\Program Files\Python37,, 'C:\Program Files\Python37\lib\site-packages']| 
以 上 程序 中 ， 需 要 说 明 以 下 几 点 : 
e import sys 负责 引入 Python 标准 库 中 的 syspy 模块 ; 这 是 引入 某 一 模块 的 方法 ， 随 后 将 
介绍 。 
e sys.argv 是 一 个 包含 命令 行 参数 的 列表 。 
e sys.path 也 是 一 个 列表 ， 其 中 包含 Python 解释 器 上 自动 查找 所 需 模 块 的 路 径 。 


8.1.2 import 语句 
为 了 使 用 Python 源 文件 ， 需 要 在 另 一 个 源 文 件 里 执行 import 语句 ， 语 法 如 下 
import modulel[, module2[.... moduleN] 


= Py 解释 器 过 到 import 语句 ， 如 果 模 块 在 当前 的 搜索 路 径 中 ， 就 会 被 导入 。 
搜索 路 径 是 一 个 列表 ， 里 面包 含 Python 解释 器 会 进行 搜索 的 所 有 目录 。 人 例如， 下面 有 一 个 
模块 ch08test model， 要 想 导 入 该 模块 ， 需 要 把 命令 放 在 脚本 的 顶端 : 


#1/usr/binpython3 
# 文件 名 : ch08test model.py 
def prmt func( par ): 
print ("Hello : ". par) 
retum 
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在 另 一 文件 ch08testpy 中 引入 ch08test model 模块 ， 代 码 如 下 : 


#1/usr/bim/python3 

# 文件 名 : ch08testpy 

# 导入 模块 

import chO8test model 

# 现在 可 以 调用 模块 里 包含 的 函数 了 
chogtest model.prmt func("Runoob") 


使 用 以 下 方式 执行 程序 : 


D:\pyproject>python3 chO8test.py 

Hello : Runoob 

在 Python 中 ， 一 个 模块 只 会 被 导入 一 次 ， 而 人 不管 执 行 了 多 少 次 导入 。 这 样 可 以 防止 导入 模 
块 被 一 思 又 一 轴 地 执行 。 


8.1.3 ”搜索 路 径 


当 使 用 jmport 语句 的 时 候 ，Python 解释 器 怎样 找到 对 应 的 文件 ? 

这 就 涉及 Python 的 搜索 路 径 , 搜索 路 径 是 由 一 系列 目录 名 组 成 的 , Python 解释 器 依次 从 这 
些 目录 中 寻找 引入 的 模块 。 

这 看 起 来 很 像 环境 变量 ， 事 实 上 ， 也 可 以 通过 定义 环境 变量 的 方式 来 确定 搜索 路 径 。 

搜索 路 径 是 在 Python 编译 或 安装 的 时 候 确定 的 ， 安 装 新 的 库 时 应 该 也 会 被 修改 。 搜索 路 径 
被 存储 在 sys 模块 的 path 变量 中 ， 例 如 ， 在 交互 式 解释 器 中 ， 输 入 以 下 代码 ; 


>>> 1mport sys 
>>> sys.pa 了 h 
[", 'C:\Program Files\Python3\python37.z1p', "C:\Program Files\Python3\DLLs', 'C:\Proegram Flles 
\Python37 Wb', 'Ci\Proeram Files\Python37", 'C:\Proeram FlleswPython37wWllbwslte-packagpes | 
其 中 ，sys.path 的 输出 是 一 个 列表 ， 其 中 第 一 项 是 空 串 "， 代 表 当 前 目录 ( 右 从 一 个 脚本 中 打 
印 出 来 ， 则 可 以 更 清楚 地 看 出 是 哪个 目录 )， 即 执行 Python 解释 器 的 目录 (对 于 脚本 来 说 就 是 运 
行 的 脚本 所 在 的 目录 )。 因 此 ， 在 当前 目录 下 知 存 在 与 要 引入 模块 同名 的 文件 ， 就 会 把 要 引入 的 
模块 屏蔽 邱 。 
了 解 了 搜索 路 径 的 概念 ,就 可 以 在 脚本 中 修改 syspath 来 引入 一 些 不 在 搜索 路 径 中 的 模块 。 
现在 ， 在 Python 解释 器 的 当前 目录 或 sys.path 的 某 个 目录 中 创建 fbo.py 文件 ， 代 码 如 下 : 
# 斐 波 那 契 数列 模块 
deffib):  # 定义 从 1 到 mn 的 斐 波 那 契 数列 
4a.b=0 1 
whle b <=n: 
print(b, end= ") 
ab=b at+b 
printO 


deffib2(n):  # 返回 从 1 到 ma 的 斐 波 那 契 数列 
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Tesult = [| 
ab=0.1 
whie b <n: 
result.append(b) 
a.b=b.atb 
Tetum result 


然后 进入 Python 解释 强 ， 使 用 下 面 的 命令 导入 这 个 模块 : 
>>> import fibo 


这 样 做 并 没有 把 直接 定义 在 fibo 模块 中 的 函数 名 称 写 入 当前 符号 表 ， 只 是 把 fibo 模块 的 名 
称 写 到 那里 。 可 以 使 用 模块 名 称 来 访问 函数 ， 例 如 : 

>>> import fibo 

>>> fibo.fib(100) 

112358132]1345589 

>>> fibo.fib(500) 

112358132]1345589 144 233 377 

>>> fibo. name 

‘fibo' 


如 果 打 算 经 名 使 用 茶 个 函数 ， 可 以 把 它 赋 给 一 个 变量 ， 例 如 : 


>>> 名 =fibo.fib 
>>> fib(500) 
1123581321345589 144233 377 


8.1.4 from…import 语句 
Python 的 from 语句 用 于 从 模块 中 导入 指定 的 部 分 到 当前 名 称 空间 中 ， 语 法 如 下 
from modname mport namel|. name2|. ... nameN || 


例如 ， 要 导入 fibo 模块 中 的 名 函数 ， 可 以 使 用 如 下 语句 : 


>>> from fibo import fib, fib2 
>>> fib(500) 
1123581321345589 144 233 377 


这 个 声明 不 会 把 整个 fibo 模块 导入 当前 的 名 称 空间 中 ， 而 只 会 将 fibo 模型 中 的 fb 函数 引 
把 一 个 模块 的 所 有 内 容 导 入 当前 的 名 称 空间 也 是 可 行 的 ， 可 以 通过 ffom…import * 语 句 来 
实现 ， 语 法 格式 如 下 : 


from modname Import * 


这 提供 了 一 种 简单 的 方法 来 导入 一 个 模块 中 的 所 有 项 目 。 然 而 这 种 声明 不 该 被 过 多 地 使 用 ， 
因为 当 不 同 模块 中 包含 相同 的 函数 时 ， 这 容易 引起 函数 名 冲突 。 更 明智 的 做 法 应 该 是 从 模块 中 
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导入 指定 的 部 分 到 当前 名 称 空 间 中 ， 语 法 如 下 : 
from modname import namel.name2,.. nameN 
不 例如 下 : 
frommodimport func 1  # 导 入 mod 模块 中 的 func 1 函数 


这 个 声明 不 会 把 整个 mod 模块 导入 当前 名 称 空间 中 ， 而 只 会 将 mod 模块 中 的 func_1 函数 
引入 执行 该 模块 的 全 局 符号 表 中 。 


8.1.5 ”创建 模块 


除了 标准 模块 外 ，Python 还 允许 程序 员 自 定义 模块 。 
模块 中 既 能 定义 函数 、 类 和 变量 ， 也 能 包含 可 执行 代码 。 新 建 模块 文件 modle 1.py， 内 容 
如 下 : 


def p func(are): 

print(hello',are) 

retum 
在 该 模块 中 定义 了 一 个 方法 p_func0， 它 接收 一 个 参数 arg， 输 出 “hello, X xX X ”字样 。 
下 面 新 建 主 模块 文件 mainpy， 内 容 如 下 


from modle 1 importp fnc  # 导 入 模块 modle 1 中 的 p fonc 函数 


并 name 一 "” main ": # 断 是 否 为 主 程序 执行 入 口 
p_func(python') 
目 定 义 模 块 的 使 用 方法 和 标准 模块 一 样 ， 都 通过 import 和 from model name import * 等 语句 


8.1.6 ”安装 第 三 方 模块 


在 Python 中 ， 除 了 内 置 模块 、 标 准 模块 之 外 ， 还 有 第 三 方 模块 (又 称 扩 展 模块 ) 可 以 使 用 。 
第 三 方 模块 在 使 用 前 需要 先 安 装 。 

在 Python 中， 第 三 方 模块 的 安装 是 通过 setuptools 这 个 工具 完成 的 。Python 有 两 个 封装 了 
setuptools 的 包 管 理工 具 : easy install 和 pip。 有 目前 官方 推荐 使 用 pip。 

如 果 使 用 的 是 Mac 或 Linux 系统 ， 安 装 pip 本 对 这 个 步 又 就 可 以 跳 过 了 。 如 果 使 用 的 是 
Windows 系统 ， 确 保安 装 时 勾 选 了 pip 和 Add python.exe to Path。 

在 命令 提示 符 窗口 中 尝试 运行 pip， 如 果 Windows 系统 提示 未 找到 命令 ， 可 以 重新 运行 安 
装 程序 以 添加 pip。 

下 面 通过 安装 第 三 方 库 Python Imaging Library 来 说 明 第 三 方 模块 的 使 用 , 这 是 Python 中 的 
一 个 非常 强大 的 用 于 处 理 图 像 的 工具 库 。 一 般 来 说 ， 第 三 方 库 都 会 在 Python 官方 的 
pypipython.org 网 站 上 注册 ， 要 安装 一 个 第 三 方 库 ， 必 须 先知 道 该 库 的 名 称 ， 可 以 在 Python 官 
网 上 搜索 ， 比 如 Python Imaging Library 的 名 称 是 PILL。 因 此 ， 安 装 Python Imaging Library 的 命 
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pip Install PIL 


压 心 等 每 下 载 并 安装 后 ， 束 可 以 使 用 PIL 了 。 
有 了 PLL， 人 处理 图 片 易如反掌 。 随 便 找 张 图 片 ， 生 成 颖 略图 ， 示 例 程 序 如 下 : 


>>> Import Image 

>>> Im = Image.open( test.pne’) 

>>> prmt mformat, im.size, Imnmode 
PNG (400. 300) RGB 

>>> ImLthumbnall((200. 100)) 

>>> 1m.save( thumb.yppe', "JPEG'") 


其 他 利用 的 第 三 方 库 还 有 用 于 MySQL 的 MySQL-python， 用 于 科学 计算 的 NumPy， 用 于 
生成 文本 的 模板 工具 Jinja2， 等 等 。 


异 块 的 高 级 技术 


模块 中 除了 方法 定义 ， 还 可 以 包括 可 执行 代码 。 这 些 代 码 一 般 用 来 初始 化 模块 。 这 些 代码 
只 有 在 第 一 次 导入 时 才 会 被 执行 。 

每 个 模块 有 各 自 独 立 的 符号 表 ， 在 模块 内 部 ， 所 有 的 函数 被 当 作 全 局 符号 表 使 用 。 所 以 ， 
模块 的 作者 可 以 放心 大 胆 地 在 模块 内 部 使 用 这 些 全 局 变量 ， 而 不 用 担心 把 其 他 用 户 的 全 局 变量 
搞 乱 。 

男 一 方面 ， 当 明确 知道 要 做 什么 村， 可 以 通过 modname.itemname 这 样 的 表示 法 来 访问 模 
块 内 的 函数 。 

在 模块 中 是 可 以 导入 其 他 模块 的 。 在 一 个 模块 (或 者 脚本 ， 或 者 其 他 地 方 ) 的 最 前 面 使 用 
import 可 导入 另 一 个 模块 ， 当 然 ， 这 只 是 惯例 ， 而 非 强制 ， 但 最 好 遵从 。 被 导入 模块 的 名 称 将 
被 放 入 当前 所 操作 模块 的 符号 表 中 。 

还 有 一 种 导入 方法 ， 可 以 使 用 import 直接 把 模块 内 函数 、 变 量 的 名 称 导入 当前 操作 的 模块 
中 。 例 如 : 


>>> from fibo import fib, fib2 
>>> fib(500) 
1 1235813213455 89144233377 


这 种 导入 方法 不 会 把 被 导入 模块 的 名 称 放 在 当前 所 操作 模块 的 字符 表 中 ， 所 以 ， 以 上 示例 
中 的 fibo 这 个 名 称 没有 经 过 定义 。 

此 外 ， 可 以 一 次 性 把 模块 内 所 有 了 男 数 、 变 量 的 名 称 导 入 当前 所 操作 模块 的 字符 表 中 ， 示 例 
如 下 : 


>>> from fibo mport * 
>>> fib($500) 


170 


第 8 章 模 块 


11233813213435589 144 233 377 


以 上 程序 将 把 所 有 名 字 都 导入 ， 除 了 那些 由 单 下 划 线 ( ) 开 头 的 名 字 。 大 多 数 情况 下 ， 不 应 
使 用 这 种 方法 导入 模块 ， 因 为 一 旦 同名 ， 束 很 可 能 履 兰 己 有 的 定义 。 


8.2.1 name 属性 


模块 在 被 男 一 个 程序 第 一 次 引入 时 ， 其 主 程序 将 运行 。 如 果 想 在 模块 被 引入 时 ， 让 模块 中 
的 某 一 程序 块 不 执行 ， 可 以 使 用 name ”属性 ， 让 该 程序 块 仅 在 模块 自身 运行 时 执行 。 示 例 程 
序 如 下 : 


#1/usr/bm/python3 
# 文 件 名: using name py 


i name 一 mam 1 
print( 程 序 本 上 身 在 运行 ') 
else: 
print( 在 男 一 模块 中 运行 ") 


下 面 运行 程序 并 输出 : 


Cprolects>python usme name.py 
程序 本 身 在 运行 


Cprojects>python 

Python 3.7.1 (v3.7.1:260ec2c36a, Oct 20 2018. 14:57:15) [MSC v.1915 64 bit (AMD64)] on wim32 
Type "help", "copyrieht", "credits" or "license" for more ntormation. 

>>> Import usne name 

在 另 一 模块 中 运行 


需要 注意 的 是 ， 每 个 模块 都 有 ”name 属性 ， 当 值 是 ”main ' 时 ， 表 明 模 块 自身 在 运行 ， 
否则 是 被 引入 。 


8.2.2 dir 梁 数 


dir 函数 是 Python 内 置 函 数 ， 通过 dir 函数 可 以 找到 模块 内 定义 的 所 有 名 称 ， 并 以 字符 串 列 
表 的 形式 返回 ， 示 例 程序 如 下 : 


>>> Import Using name 

>>> dir(usme name) 

[ bultns ',' cached '' doc ”He ',' loader ',' name ',' .” spec | 

>>> IMPpOIt SYS 

>>> dir(sys) 

[ breakpomthook ',’ displayhook ',' doc ',' excepthook ',' mteractivehook ',' loader ., 
”name '.' package ',' spec ”stder ',' stdm ‘,' stdout ”clear type cache',’ curent frames, 


' debugmallocstats'. ' enablelegacywindowsfsencodine'.' framework',' getframe'.' git',' home',' xoptions. 
apl version', "arev", Dase exec prefix'", Dase prefix'. breakpomthook, bultn module names', 'byteorder', call tracne,, 
'callstats', 'copyrieht', dsplayhook. "dllhandle', ‘dont write bytecode', 'exc into，excepthook 'exec prefix', 'executable', 


| 


exXlt. flags', float mto', "float repr style', 'get asyncgen hooks'，pet coroutine oriem trackine depth', 

'get coroutine wrapper', ‘getallocatedblocks', 'getcheckmterval', 'getdefaultencodine', 'getfilesystemencodeerrors,, 
'getfilesystemencodne'. 'getprofile'. ‘getrecursionlimut' petretcount 'getslzeof, 'getswitchmterval'. 'gettrace', 
'getwindowsverslon', hash mto', hexversion', Implementation’, Imt mto’, Interm ,ls finalizme,, ‘ast traceback,., 

ast type', last value', ‘maxsize'", maxunicode', meta path', ‘modules', 'path', path hooks', path rmporter cache.', 
‘platformy', preftx 'ps1', 'ps2", 'set asyncgen hooks', 'set coroutine origm trackine depth', 'set coroutine wrapper, 
'setcheckinterval'. 'setprofile'. 'setrecursionlimit', 'setswitchinterval', 'settrace', 'stderr', 'stdin', 'stdout', thread mto'. Verslon . 
‘version nfo', ‘wamoptions', “Winver | 


如 果 没 有 给 定 参 数 ， 那 么 di 函数 会 列 出 当前 定义 的 所 有 名 称 ， 示 例如 下 : 


>>>]hst = [Ta',b' cd,e | 

>>> IMpOIt SYS 

>>> sys.print(a') 

Traceback (most recent call last): 

Flle "<stdm>", lme 1, m <module> 

AttributeError: module 'sys' has no attmbute ‘print 

>>> print(sys.path) 

[", C:\Program Files\python3 \python37.zp', "C:\Program Files\python3\DLLs', 'C:\\Program Flles 
wpython37whnb'C:wWProgram Files\python37", 'C:\Prosram Files\python37\\lib\site-packages'| 

>>> dir0 ”# 得 到 当前 模块 中 定义 的 属性 列表 

[ annotations ',” bultms ”doc ',' loader ',' name ',' package ',' spec ', list', 'sys' 


usme name'| 

>>>]ist=5 # 建立 新 的 变量 list 

>>> dir() 

[ annotations '`,” bulltms .” doc ',' loader ',' name ',' package ',' Sspec ', list', 'sys' 
msimg name'| 

>>> del list # 删除 变量 list 

>>> dir() 

[ annotations '`,” bulltms .” doc ',' loader ',' name ',' packapge ',' spec ','sys, 
‘usme name'| 

>>> 


Python 中 的 包 


在 创建 许 许 多 多 模块 后 ， 我 们 可 能 希望 将 某 些 功能 相近 的 文件 组 织 到 同一 文件 夹 下 ， 这 里 
就 需要 运用 包 的 概念 了 。 本 节 主 要 介绍 Python 中 的 包 。 
8.3.1 包 的 定义 

包 对 应 于 文件 夹 ， 包 的 使 用 方式 跟 模 块 类 似 ， 唯 一 需要 注意 的 是 ， 当 把 文件 夹 当 作 包 使 用 
时 , 文件 夹 需要 包含 _init .py 文件 , 主要 是 为 了 避免 将 文件 夹 名 当 作 普 通 的 字符 串 。 init .py 
的 内 容 可 以 为 室 ， 一般 用 来 进行 包 的 某 些 初始 化 工作 或 者 设置 al 值 ， al 用 在 from 
package-name import * 语 句 中 ， 可 全 部 导出 定义 过 的 模块 。 
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通 第 ， 包 总 是 一 个 目录 ， 可 以 使 用 import 导入 包 ， 或 者 使 用 from + import 导入 包 中 的 部 分 
模块 。 包 目录 中 为 首 的 文件 便 是 _init .py， 然 后 是 一 些 模 块 文件 和 子 目 录 ， 假 如 子 目 录 中 也 
有 init py， 那 么 它 就 是 这 个 包 的 子 包 了 。 

由 此 可 见 , 包 是 一 种 有 层次 的 文件 目录 结构 , 它 定 义 了 由 nn 个 模块 或 n 个 子 包 组 成 的 Python 
应 用 程序 执行 环境 。 通 俗 一 点 讲 ， 包 是 一 个 包含 ”init .py 文件 的 目录 ， 该 目录 下 一 定 得 有 
”init _.py 文件 和 其 他 模块 或 子 包 。 


8.3.2 包 的 导入 


可 以 从 包 中 导入 单独 的 模块 。 导 入 方式 包括 以 下 3 种 。 
(1) 使 用 全 路 径 名 导入 包 中 的 模块 ， 语 法 格式 如 下 : 


import PackageA.SubPackageA ModuleA 

(2) 可 以 直接 使 用 模块 名 而 不 用 加 上 包 前 级 导 入 模块 ， 语 法 格式 如 下 : 
from PackageA.SubPackageA import ModuleA 

(3) 也 可 以 直接 导入 模块 中 的 函数 或 变量 ， 语 法 格式 如 下 : 

from PackageA.SubPackageA ModuleA import fimctionA 


当 使 用 fom package import item 时 ，item 可 以 是 package 的 子 模块 或 子 包 ， 或 是 其 他 定义 
在 包 中 的 函数 、 类 或 变量 。Python 首先 检查 item 是 否定 义 在 包 中 ， 如 果 没 找到 ， 束 认为 item 
是 一 个 模块 并 尝试 加 载 它 ， 失 败 时 会 抛 出 ImportError 异 香 。 

当 使 用 import item.subitem.subsubitem 语法 格式 导入 包 中 的 模块 时 ，subsubitem 之 前 的 
subitem 必须 是 包 ，subsubitem 可 以 是 模块 或 包 ， 但 不 能 是 类 、 函 数 和 变量 。 

当 使 用 from package import * 导 入 模块 时 ， 如 果 包 的 ”init .py 文件 中 定义 了 一 个 名 为 
_all 的 列表 变量 ， 那 么 其 中 包含 的 模块 名 称 列表 将 作为 被 导入 的 模块 列表 。 如 果 没 有 定义 
”al _， 和 那么 这 条 语句 不 会 导入 package 的 所 有 子 模 块 ， 而 只 保证 package 被 导入 ， 然 后 导入 
定义 在 包 中 的 所 有 函数 、 类 或 变量 。 


8.3.3” 包 的 组 织 


为 了 组 织 好 模块 ， 将 多 个 模块 分 为 一 个 包 。 包 是 Python 模块 文件 所 在 的 目录 ， 且 该 目录 下 
必须 存在 _init py 文件。 第 见 的 包 结 构 如 下 : 


package a 
oo init py 
oo— module alpy 
[一 一 module a2.py 
package b 
oo init py 
上 -一 module bl.py 
-一 一 module b2.py 
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假设 有 一 个 main.py 文件 ， 如 果 main.py 想 要 引用 package a 中 的 模块 module al， 可 以 使 
用 以 下 语句 导入 : 

from package a mport module al 

import package amodule al 

如 果 package a 中 的 module al 需要 引用 package b， 那 么 默认 情况 下 ，Python 是 找 不 到 
package b。 可 以 使 用 sys.path.append(.. 门 ， 在 package a 中 的 ”init .py 文件 中 添加 这 条 语句 ， 
然后 为 package a 中 的 所 有 模块 都 添加 * import ”init 即 可 。 


常用 内 建 模块 


Python 本 身 为 用 户 提供 了 许多 有 用 的 内 建 模 块 ， 可 以 根据 业务 需要 选用 。 本 节 介 绍 一 些 比 
较 第 用 的 内 建 模块 。 


8.4.1 collections 


collections 是 Python 内 建 的 集合 模块 ， 提 供 了 许多 有 用 的 集合 类 ， 可 以 根据 需要 选用 。 下 
面 介绍 一 些 常 用 的 集合 类 。 


1.namedtuple 
我 们 知道 元 组 可 以 表示 不 变 集合 。 例 如 ， 一 个 点 的 三 维 坐 标 就 可 以 表示 成 : 
>>>p=(],2) 


但 是 ， 看 到 (1, 2)， 很 难看 出 这 个 元 组 是 用 来 表示 坐标 的 。 但 是 ， 定 义 一 个 类 又 显得 小 题 大 


>>> from collections import namedtuple 
>>> Point = namedtuple(Point',['x','y']) 
>>> p= Pomt(1,2) 

>>> px 

] 

>>> py 

2 


namedtuple 是 一 个 函数 ， 用 来 创建 目 定 义 的 tuple 对 象 ， 并 量规 定 了 tuple 元 素 的 个 数 ， 可 
以 用 属性 而 不 是 索引 来 引用 tuple 的 某 个 元 素 。 

这 样 一 来 ， 用 namedtuple 可 以 很 方便 地 定义 一 种 数据 类 型 ， 既 有 具备 元 组 的 不 变性 ， 又 可 以 
根据 属性 来 引用 ， 使 用 十 分 方便 。 

可 以 验证 创建 的 Point 对 象 是 不 是 tuple 的 子 类 ， 示 例如 下 : 


>>> 1sInstance(p, Pomt) 
True 
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>>> 1sInstance(p., tuple) 
True 


类 似 地 ， 如 果 要 用 坐标 和 半径 表示 圆 ， 也 可 以 用 namedtuple 来 定义 ， 例 如 : 


# namedtuple(' 名 称 ', [属性 list]): 
Circle = namedtuple(' Circle', [x', Y', TD) 


2. deque 


使 用 列表 存储 数据 时 ， 按 索引 访问 元 素 很 快 ， 但 是 插入 和 删除 元 素 就 很 惕 了 ， 因 为 列表 采 
用 的 线性 存储 方式 ， 数 据 量 大 的 时 候 ， 插 入 和 删除 效率 很 低 。 
deque 是 用 于 高 效 实现 插入 和 删除 操作 的 双向 列表 ， 适 合用 于 队列 和 栈 。 例 如 : 


>>> from collections import deque 
>>> q= deque(['a'. b', 'c"|) 

>>> q.append('x') 

>>> q.appendleft(y'") 

| 


deque(['y', 'a'. TD 'c', x'D 


deque 除了 实现 列表 的 append0 和 pop0 方 法 外 ， 还 文 持 appendleft0 和 popleft0 方 法 ， 这 样 
就 可 以 非常 高 效 地 往 头 部 添加 或 删除 元 素 。 


3. defaultdict 


使 用 字典 时 ， 如 果 引 用 的 键 不 存在 ， 就 会 抛 出 KeyError 异常 。 如 果 希 望 键 不 存在 时 返回 默 
认 值 ， 就 可 以 使 用 defaultdict， 例 如 : 


>>> fiom collections import defaultdict 

>>> dd = defaultdict(lambda: "N/A'") 

>>> dd[key1'] = 'abc' 

>>> dd['key1']# keyl 存在 

'abe’ 

>>> dd[key2]# key2 不 存在 ， 返 回 默认 值 
N/A 


注意 ， 默 认 值 是 调用 函数 返回 的 ， 而 函数 在 创建 defaultdict 对 象 时 传 入 。 除 了 在 键 不 存在 
时 返回 默认 值 ，defaultdict 的 其 他 行为 跟 字 有 典 是 完全 一 样 的 。 


4. OrderedDIct 


使 用 字典 时 ， 键 是 无 序 的 。 在 对 字典 做 碗 代 时 ， 我 们 无 法 确定 键 的 顺序 。 如 果 要 保持 键 的 
顺序 ， 可 以 使 用 OrderedDict。 例 如 : 


>>> fiom collections import OrderedDict 
>>> d= dict|(a., 1), Cb' 2). Ce', 3)MD 
>>>d # 字典 中 的 键 是 无 序 的 
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>>> od = OrderedDict([(a', 1)., Cb', 2). (Cc', 3)D 
>>> od #OrderedDict 中 的 键 是 有 序 的 
OrderedDict([(a'. 1), Cb'. 2), Ce', 3)D 


注意 ，OrderedDict 中 的 键 会 按照 插入 的 顺序 排列 ， 从 以 下 示例 程序 可 以 看 出 : 


>>> 0d = OrderedD1ict() 


>>> od|7|= 1 

>>>od[y]=2 

>>> 0d| Xx'|=3 

>>> 0odkeys0 # 按照 插入 的 顺序 返回 

Ly 

OrderedDict 可 以 实现 先进 先 出 EF 正 0) 的 字典 ， 当 容量 超出 限制 时 ， 先 删除 最 早 添加 的 键 。 
示例 如 下 : 

from collections Import OrderedDct 


class LastUpdatedOrderedDict(OrderedDict): 


def Inlt (selt capacity): 
Super(LastUpdatedOrderedDIict self). mt Q 
selt. capacity = capacity 


def setitem (selt, key, value): 
contamnsKey = 1 1{ key m self else 0 
lf len(self) - contamskey >= self. capacity: 
last = self.popitem(last=False) 
print remove:', last 
1i{ contamsKey: 
del self[key] 
pnnt 'set:", (key, value) 
else: 
print 'add… (key, value) 
OrderedDict. setitem (selt, key, value) 


D. Counter 
Counter 是 一 个 简单 的 计数 器 ， 用 于 统计 字符 出 现 的 个 数 ， 示 例如 下 : 


>>> from collections 1mport Counter 

>>> ¢ = Counter() 

>>> for ch in programmine: 
cich|=clchl+1 


> 
Coumtend {pe: 2, m2 T7221 T1011,P:1) 
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Counter 实际 上 也 是 Dict 的 了 类， 从 上 面 的 结果 可 以 看 出 ， 字 符 g、m、T 各 出 现 了 两 次 ， 
其 他 字符 各 出 现 了 一 次 。 


8.4.2 base64 


base64 是 一 种 常见 的 可 将 任意 二 进 制 数据 转换 为 文本 字符 串 的 编码 方法 ， 常 用 于 在 URL、 
Cookie、 网 页 中 传输 少量 二 进 制 数 据 。 

当 用 记事 本 打开 .exe、.jjpg、.pdf 文件 时 ， 会 看 到 一 大 堆 乱 码 ， 这 是 因为 二 进 制 文 件 包 含 很 
多 无 法 显示 和 打印 的 字符 。 所 以 ， 如 果 想 要 让 记事 本 这 样 的 文本 处 理 软件 能 处 理 二 进 制 数据 ， 
就 需要 一 种 转换 方法 。base64 是 一 种 常见 的 二 进 制 编码 方法 。 

base64 编码 的 原理 很 简单 ， 首 先 ， 准 备 一 个 包含 64 个 字符 的 数组 : 


[A', BC a, b,c, 0,1 .+ 


然后 ， 对 二 进 制 数据 进行 处 理 ， 每 3 个 字 节 一 组 ， 一 共有 3X8=24 位 ， 划 为 4 组 ， 每 组 正 
好 6 位， 如 图 8-1 所 示 。 


pb1 b2 b3 


8-1 ”base64 编码 


这 样 就 得 到 4 个 数字 作为 索引 ， 然 后 但 询 编 码 表 ， 获 得 相应 的 4 个 字符 ， 这 就 是 编码 后 的 
字符 串 。 所 以 ,base64 编码 会 把 3 字 节 的 二 进 制 数据 编码 为 4 字 节 的 文本 数据 ,长 度 增加 33%， 
好 处 是 编码 后 的 文本 数据 可 以 在 邮件 正文 、 网 页 是 直接 显示 。 

如 果 要 编码 的 二 进 制 数据 不 是 3 的 倍数 ， 怎 么 办 ? base64 编码 用 \x00 字 节 在 末尾 补足 后 ， 
在 编码 的 末尾 加 上 一 个 或 两 个 = 符号， 表示 补 了 多 少 字 节 ， 解 码 的 时 候 ， 会 自动 去 掉 = 符 号 。 

通过 Python 内 置 的 base64 模块 可 以 直接 进行 编 解码 ， 示 例如 下 : 

>>> import base64 

>>> base64b64encode(binarywx00stringn 

YimluyYxJAHNOcmuZw 一 

>>> base64.b64decode(YmluYXJSAHNOcmluZzw 一 ) 

binarwx00sting 


由 于 执行 标准 的 base64 编码 后 可 能 出 现 字符 + 和 /， 在 URL 中 不 能 直接 作为 参数 ， 因 此 又 
有 了 一 种 url safe base64 编码 ， 其 实 就 是 把 字符 + 和 /分 别 变 成 -和 : 


>>> base64.b64encode(1T\xbN\xldxfb\xef\xff ) 


'abcdHH/ 

>>> base64.urlsafe b64encode(1xb7\xld\xfbxef\x{ff) 
abcd_ ， 

>>> base64.urlsafe b64decode(abcd-- ") 
xb7xldxfbxefixff 
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还 可 以 自己 定义 64 个 字符 的 排列 顺序 ， 这 样 就 可 以 目 定 义 base64 编码 ， 不 过 ， 通 第 情况 
下 完全 没有 必要 这 么 做 。 

base64 编码 不 能 用 于 加 密 ， 即 使 使 用 日 定义 的 编码 表 也 不 行 。base64 适用 于 小 段 内 容 的 编 
码 ， 比 如 数字 证 书 的 签名 、Cookie 的 内 容 等 。 

由 于 = 字符 也 可 能 出 现在 base64 编码 中 ， 但 = 字符 用 在 URL、Cookie 中 会 造成 歧义 ， 因 此 ， 
很 多 情况 下 在 进行 base64 编码 后 会 把 = 符号 去 掉 : 

# 标准 base64 编码 : 

abcd > YWJZA 一 

# 上 自动 去 掉 = 符 号 : 

abcd -> "YWJIZA' 

去 挥 = 符号 后 怎么 解码 呢 ? 因 为 base64 编码 是 把 3 个 字 节 变 为 4 个 字 节 ， 所 以 base64 编码 
的 长 度 永远 是 4 的 倍数 。 因 此 ， 需 要 加 上 = 符号 来 把 base64 字符 串 的 长 度 变 为 4 的 倍数 ， 这 样 
就 可 以 正 剃 解码 了 。 


8.4.3 struct 


准确 来 讲 ，Python 没有 专门 处 理 字 节 的 数据 类 型 。 但 由 于 str 既 表 示 字 符 串 ， 又 可 以 表示 
字 节 ， 因 此 字 节 数组 二 st。 而 在 C 语言 中 ， 可 以 很 方便 地 用 struct、union 处 理 字 节 ， 以 及 字 节 
和 int: float 类 型 间 的 转换 。 在 Python 中 ， 要 把 一 个 32 位 的 无 符号 整数 变 成 字 节 ， 也 就 是 4 字 
节 长 度 的 st， 得 配合 位 运算 符 这 么 写 : 

>>> n= 10240099 

>>> bl = chr((n & Oxff000000) >> 24) 

>>> b2 = chr((n & Oxff0000) >> 16) 

>>>b3=chr((n & Oxff00) >> 8) 

>>> b4= chrn & Oxft) 

>>>s=bl +b2+b3+b4 

>>>s 

x00x9c@c 


非 第 拱 烦 。 换 成 浮 点 数 就 无 能 为 力 了 。 

Python 提供 了 struct 模块 来 解决 str 和 其 他 二 进 制 数据 类 型 间 的 转换 。struct 模块 的 pack 桥 
数 能 把 任意 数据 类 型 转换 成 字符 串 ， 例 如 : 

>>> import struct 

>>> struct.pack(>1, 10240099 ) 

"x00wx9c@e' 


pack 函数 的 第 一 个 参数 是 处 理 指令 ，>T 表 达 式 中 ,> 表示 字 节 顺序 是 big-endian， 也 就 是 网 
络 序 ，I 表示 4 字 节 的 无 符号 整数 。 后 面 的 参数 个 数 要 和 处 理 指令 一 致 。 
unpack 函数 能 把 str 变 成 相应 的 数据 类 型 ， 例 如 : 


>>> struct.unpack(>IH. ‘xf0\xf0\xfO\xfO\x80x80") 
(4042322160, 32896) 


178 


第 8 章 模 块 


根据 >IH， 后 面 的 str 依次 变 为 Id4 字 节 的 无 符号 整数 ) 和 HC 字 节 的 无 符号 整数 )。 

所 以 ， 尽 管 Python 不 适合 编写 在 底层 操作 字 节 流 的 代码 ， 但 在 对 性 能 要 求 不 高 的 地 方 ， 利 
用 struct 模块 就 方便 多 了 。 

Windows 的 位 图 文件 (.bmp 文件 ) 是 一 种 非常 简单 的 文件 ， 在 这 里 用 struct 模块 分 析 一 下 。 

首先 找到 一 个 .bmp 文件 ， 然 后 读 入 前 30 个 字 节 进行 分 析 : 

>>>s='"%42xA4dx38x8cxO0axO00mxO0wO0xOO0mwO0mw36mw00mx00mx00x28x00m00x00x80w02x00w00m68\ 
X01 xO0xO00x01x00x] x00' 


BMP 格式 采用 小 痛 方 式 存 储 数据 ， 文 件 头 的 结构 按 顺序 如 下 。 
两 个 字 节 : BM' 表 示 Windows 位 图 ，'BA' 表 示 OS/2 位 图 。 
一 个 4 字 节 整数 : 表示 位 图 大 小 。 

一 个 4 字 节 整数 : 保留 位 ， 始 终 为 0。 

一 个 4 字 节 整数 :实际 图 像 的 偏 移 量 。 

一 个 4 字 节 整数 : 文件 头 的 字 节 数 。 

一 个 4 字 节 整数 ， 图 像 宽 度 。 

一 个 4 字 节 整数 : 图像 高 度 。 

一 个 2 字 节 整数 : 始终 为 1。 

一 个 2 字 节 整数 : 颜色 数 。 

所 以 ， 组 合 起 来 就 是 使 用 unpack 函数 进行 如 下 读 取 : 


>>> struct.unpack('<ccIIHIHHH., s) 
(CB'. M. 691256. 0. $54. 40. 640. 360, 1. 24) 


结果 显示 ，'B'、M' 说 明 是 Windows 位 图 ， 位 图 大 小 为 640 像素 X360 像素 ， 颜 色 数 为 24。 
8.4.4 hashlib 


摘要 算法 在 很 多 地 方 都 有 广泛 的 应 用 。 需 要 注意 , 摘要 算法 不 是 加 密 算 法 , 不 能 用 于 加 密 ( 因 
为 无 法 通过 摘要 反 推 明文 )， 只 能 用 于 防 算 改 , 但 是 它 的 单 向 计算 特性 决定 了 可 以 在 不 存储 明文 
口令 的 情况 下 验证 用 户口 令 。 

Python 的 hashlib 模块 提供 了 常见 的 摘要 算法 ， 如 MD5、SHAL1 等 。 

什么 是 摘要 算法 呢 ? 摘要 算法 又 称 哈 希 算法 、 散 列 算法 。 它 通过 一 个 函数 ， 把 任意 长 度 的 
数据 转换 为 长 度 固 定 的 数据 串 ( 通 第 以 十 六 进 制 的 字符 串 表 示 )。 

举 个 例子 ， 有 一 扁 文 章 ， 内 容 是 一 个 字符 串 how to use python hashlib - by Michael， 并 附 上 
这 篇 文章 的 摘要 是 '2d73d4f15c0db7f5ecb321b6a65e5d6d'。 如 果 有 人 算 改 这 篇 文章 , 并 发 表 为 how 
to use python hashlib - by Bob', 那么 可 以 一 下 子 指出 Bob 算 改 了 自己 的 文章 , 因为 根据 how to use 
python hashlib - by Bob' 计 算出 的 摘要 不 同 于 原始 文章 的 摘要 。 

可 见 ， 摘 要 算法 就 是 通过 摘要 函数 了 对 任意 长 度 的 数据 计算 出 固定 长 度 的 摘要 ， 目 的 是 发 
现 原始 数据 是 否 被 人 算 改 过 。 

摘要 算法 之 所 以 能 指出 数据 是 否 被 算 改 过 ， 就 是 因为 摘要 函数 是 单 癌 函 数 ， 计 算 ftdata) 很 
容易 ， 但 通过 摘要 反 推 数据 却 非常 困难 。 而 且 ， 哪 怕 只 对 原始 数据 的 一 位 做 修改 ， 都 会 导致 计 
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算出 的 摘要 完全 不 同 。 
这 里 以 常见 的 摘要 算法 MD5 为 例 ， 计 算 一 个 字符 串 的 MD5 值 : 


import hashlib 


mds = hashlib.md$0 

md$ .update(how to use mds m python hashlib?") 

print mdS.hexdigest() 

计算 结果 如 下 : 

d26aS3730bc40b38b63SaS20292169306 

如 果 数 据 量 很 大 ， 可 以 分 块 多 次 调用 update 函数 ， 最 后 计算 的 结果 是 一 样 的 : 

mds 三 hashlib.mdsO 

md$.update(how to usemds m 7) 

mds.update('‘python hashlib?") 

print mdS$.hexdigest() 

MD5 是 最 常见 的 摘要 算法 ， 速 度 很 快 ， 所 生成 结果 的 字 节 数 固 定 ， 通 常用 一 个 32 位 的 十 
六 进 制 学 符 串 表示 。 

另 一 种 常见 的 摘要 算法 是 SHA1， 调 用 SHA1 和 调用 MDS5 完全 类 似 : 


shal = hashlib.shal() 
shal.update(how to use shal Im ') 
shal.update('python hashlib?") 
print shal.hexdigest() 


生成 的 结果 通常 用 一 个 40 位 的 十 六 进 制 字符 串 表示 。 比 SHA1 更 安全 的 算法 是 SHA256 
和 SHAS12， 不 过 越 安全 的 算法 越 慢 ， 而 且 摘 要 更 长 。 

有 没有 可 能 让 不 同 的 数据 通过 某 个 摘要 算法 得 到 相同 的 摘要 ? 完全 有 可 能 ， 因 为 任何 摘要 
算法 都 是 把 无 限 的 数据 集合 映射 到 有 限 的 数据 集合 。 发 生 这 种 情况 称 为 肆 撞 ， 比 如 Bob 试图 根 
据 摘 要 反 推 出 一 篇 文章 how to learn hashlib in python -byBob'， 并 且 这 篇 文章 的 摘要 恰好 和 他 人 
的 文章 完全 一 致 ， 这 种 情况 也 并 非 不 可 能 出 现 ， 但 是 非常 困难 。 

摘要 算法 能 应 用 到 什么 地 方 ? 举 个 例子 : 任何 允许 用 户 登 录 的 网 站 都 会 存储 用 户 登 录 的 用 
户 名 和 口令 。 如 何 存储 用 户 名 和 口令 呢 ? 方法 是 存放 到 数据 库 表 中 : 


name | password 
ee 
michael |123456 
bob | abc999 
alice | alice2008 


如 果 以 明文 保存 口令 ， 那 么 当 数 据 库 汇 漏 ， 所 有 口令 就 会 落 入 黑客 手中 。 此 外 ， 网 站 运 维 
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人 员 可 以 访问 数据 库 ， 也 就 是 能 获取 到 所 有 用 户 的 口令 。 
保存 口令 的 正确 方式 是 不 存储 用 户 的 明文 口令 ， 而 是 存储 口令 的 摘要 ， 比 如 MD5 值 : 


Usemame | DasswWord 
michael |el0adc3949baS9abbeS6e0S7f20f883e 
bob | 878ef96e86145580c38c87f0410ad153 
alice 199blc2188db8Safee403b1536010c2c9 


当 用 户 登 录 时 ， 首 先 计 算 用 户 输 入 的 明文 口令 的 MDS5 值 ， 然 后 和 数据 库 中 存储 的 MD5 值 
做 对 比 。 如 果 一 致 ， 说 明 口 令 输 入 正确 ;如 果 不 一 致 ， 口 令 肯 定 错误 。 


8.4.5 ltertools 


itertools 模块 提供 的 全 部 是 用 于 处 理 进 代 功 能 的 函数 , 它们 的 返回 值 不 是 列表 ， 而 是 进 代 对 
象 ， 只 有 用 for 循环 迭代 的 时 候 才 真正 计算 。 

首先 来 看 看 itertools 模块 提供 的 几 个 “无 限 ” 迭 代 器 : 

>>> import itertools 


>>> natuals = itertools.count(]) 
>>> for n in natuals: 


printn 


因为 count0 会 创建 一 个 无 限 的 迭代 器 , 所 以 上 述 代码 会 打印 出 自然 数 序列 , 根本 停 不 下 来 
只 能 按 CultC 组 合 键 退 出 。 
cycle0 会 把 传 入 的 序列 无 限 重复 下 去 : 


>>> 1mport ltertools 
>>> cs 二 itertools.cycle(ABCOC')# 注意 字符 串 也 是 序列 的 一 种 
>>> forcincs: 

print c 


G 四 SG 


同样 停 不 下 来 。 
repeatO0 负 责 把 一 个 元 素 无 限 重复 下 去 ， 不 过 ， 提 供 第 二 个 参数 就 可 以 限定 重复 次 数 : 
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>>> ns = itertools.repeat( A', 10) 
>>> for n in ns: 
printn 


结果 打印 10 次 'A'。 
无 限 序列 只 有 在 执行 for 循环 返 代 时 才 会 无 限 地 友 代 下 去 ， 如 果 只 是 创建 一 个 友 代 对 象 ， 


就 不 会 事先 把 无 限 个 元 素 生成 出 来 ， 事 实 上 也 不 可 能 在 内 存 中 创建 无 限 个 元 系 。 


无 限 序列 虽然 可 以 无 限 达 代 下 去 ， 但 是 通 肖 会 通过 takewhile0 等 函数 ， 根 据 条 件 判断 来 堆 


取 一 个 有 限 序 列 ， 例 如 : 


>>> natuals = itertools.count(1) 
>>> ns = ltertools.takewhile(lambda x: x < 一 10. natuals) 
>>> for n in ns: 

printn 


结果 将 打印 出 1~10。 
下 面 介 绍 itertools 模块 提供 的 其 他 几 个 友 代 器 操作 函数 ， 它 们 更 加 有 用 。 


1. chain() 
chain0 可 以 把 一 组 迭代 对 象 串 联 起 来 ， 形 成 一 个 更 大 的 迭代 器 : 
for ¢ m itertools.cham( ABC'. KYZ): 
print c 
# 和 迭 代 效 果 : ABC TYTZ 
2. groupby() 
groupby0 可 以 把 迭代 器 中 相 邻 的 重复 元 素 挑 出 来 放 在 一 起 ， 例 如 : 


>>> for key, group In itertools.groupby( AAABBBCCAAA'"): 
print key, list(group) ” # 为 什么 这 里 要 使 用 list0 函 数 呢 ? 
A[A','A','A] 
BTB','B','B] 
,有 
ATA','A'.'A] 


挑选 规则 实际 上 是 通过 函数 完成 的 ， 只 要 作用 于 函数 的 两 个 元 系 返 回 的 值 相 等 ， 这 两 个 元 


系 束 被 认为 是 一 组 的 ， 并 且 把 函数 的 返回 值 作为 该 组 的 键 。 如 果 我 们 要 忽略 大 小 写 分 组 ， 就 可 
以 让 元 系 'A' 和 'a' 返 回 相 同 的 键 : 


>>> for key. eroup In itertools.eroupby( AaaBBbcCAAa' lambda c: c.upper()): 
print key. list(eroup) 
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A[A:,a.al 
BT[B','B', Db] 
[人 

A[A','A','al 


3. Imap!() 


imap0 和 map0 的 区 别 在 于 : imap0 可 以 作用 于 无 穷 序 列 , 并 且 如 果 两 个 序列 的 长 度 不 一 致 ， 
以 短 的 那个 序列 为 准 。 例 如 : 


>>> for x in itertools.imap(lambda x, y: x * y, [10. 20., 30]., itertools.count(1)): 


print x 
10 
40 
90 


注意 ，imap0 返 回 一 个 从 代 对 象 ， 而 map0O 返 回 一 个 列表 。 当 调用 map0O 时 ， 已 经 计算 完毕 : 


>>>T=Inap(lambda x: x*x, [1.2.3]) 
>>>T  ##T 已 经 计算 出 来 了 
[1. 4.9] 


当 调 用 imap0 时 ， 并 没有 进行 任何 计算 。 例 如 : 


>>>T=1tertoolsImap(ambda x: x*x, [1.2.3|) 
>>>T 

<itertools.imap object at Ox103d3ff90=> 

#T 只 是 一 个 从 代 对 象 


必须 用 for 循环 对 T 进行 迭代 ， 才 会 在 每 次 循环 过 程 中 计算 出 下 一 个 元 素 。 例 如 : 


>>> for x mT: 
print x 

1 

4 

9 


这 说 明 imap0 实 现 了 “惰性 计算 ”也 就 是 在 需要 获得 结果 的 时 候 才 计算 。 类 似 imap0 这 样 
能 够 实现 惰性 计算 的 函数 就 可 以 处 理 无 限 序列 : 


>>>T=1tertoolsImap(lambda x: x*x., tertools.count( 1)) 
>>> for n m itertools.takewhile(lambda x: x<100. 7): 
print n 


结果 是 什么 ?把 imap0 换 成 map0 去 处 理 无 限 序列 会 有 什么 结果 ? 
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>>>1= map(lambda x: x*x, 1tertools.count(1)) 
不 用 多 说 ，ifilter0 就 是 flter0 的 惰性 实现 。 
8.4.6 XML 


XML 虽然 比 JSON 复杂 ， 在 Web 中 的 应 用 也 不 如 以 前 ， 不 过 仍 有 很 多 地 方 在 用 。 所 以 ， 
有 必要 了 解 如 何 操作 XML。 

操作 XML 有 两 种 方法 : DOM 和 SAX。DOM 会 把 整个 XML 读 入 内 存 ， 解 析 为 树 ， 因 此 
占用 内 存 大 ， 解 析 慢 ， 优 点 是 可 以 任意 遍历 树 的 节点 。SAX 是 流 模 式 ， 边 读 边 解析 ， 占 用 内 存 
小 ， 解 析 快 ， 缺 点 是 需要 目 己 处 理事 件 。 

正常 情况 下 ， 优 先 考 虑 SAX， 因 为 DOM 实在 太 占 内 存 。 

在 Python 中 ， 使 用 SAX 解析 XML 非常 简洁 ， 由 于 通常 关心 的 事件 是 start_element、 
end element 和 char_data， 因 此 准备 好 相应 的 事件 处 理 函 数 ， 然 后 束 可 以 解析 XML 了。 

举 个 例子 ， 当 SAX 解析 器 读 到 一 个 节点 时 ， 会 产生 3 个 事件 : 


<a href—"/">Python</a> 


e start element 事件 ， 在 读 取 <a hre 仁 "> 时 产生 。 
e char data 事件 ， 在 读 取 Python 时 产生 。 

e end element 事件 ， 在 读 取 </a> 时 产生 。 

下 面 用 代码 实验 一 下 : 


from xml.parsers.expat mport ParserCreate 


class DefaultSaxHandler(object): 
detf start element(self. name. attrs): 
print('sax:start element: %s. attrs: 9%0s % (name, str(attrs))) 


def end element(selt name): 
print(sax:end element %s' % name) 


def char data(self, text): 
print(sax:char data: %s' %o text) 


xm| =1"<?xml verslon—"1.0"°> 
<ol> 
<]i><a href="/python">Python</a><J]> 
<li><a href="/mby">Ruby</a></]> 
</ol> 


handler = DefaultSaxHandler() 

parser = ParserCreate() 

parser.returns unicode = True 

parser. StartElementHandler = handler.start element 
parser.EndElementHandler = handler.end element 
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parser.CharacterDataHandler = handler.char data 


parser.Parse(xml) 
当 设 置 returns_unicode 为 Tue 时， 返回 的 所 有 元 素 名 称 和 char_data 都 是 Unicode， 处 理 国 
际 化 更 方便 。 


需要 注意 的 是 ， 在 读 取 一 大 段 字 符 串 时 ，CharacterDataHandler 可 能 被 多 次 调用 ， 所 以 需 
自己 保存 起 来 ， 到 了 EndElementHandler 中 再 合并 。 

除了 解析 XML 外 ， 如 何 生成 XML 了 呢 ? 99% 的 情况 下 ， 需 要 生成 的 XML 结构 都 是 非常 简 
单 的 ， 因 此 ， 最 简单 也 是 最 有 效 的 生成 XML 的 方法 是 拼接 字符 串 ， 示 例如 下 : 

L= 

L.append(r<?xml version="1.0"7>") 

L.append(r<Toot>") 

L.append(encode('some 上 data')) 

L.append(r'’</root>") 

Tetum ".Jom(L) 


如 果 要 生成 复杂 的 XML， 建议 不 要 使 用 XML， 最 好 使 用 JSON。 

由 此 可 见 ， 解 析 XML 时 ， 注 意 找 出 目 己 感 兴趣 的 节点 ， 啊 应 事件 时 ， 把 节点 数据 保存 起 
来 。 解 析 完 毕 后 ， 就 可 以 处 理 数据 。 
8.4./ HTIMLParser 

如 果 要 编写 一 个 搜索 引擎 ， 第 一 步 是 用 网 络 息 虫 把 目标 网 站 的 页 面 抓 取 下 来 ， 第 二 步 就 是 
解析 这 些 页 面 ， 看 看 里 面 的 内 容 到 底 是 新 闻 、 图 片 还 是 视频 。 

假设 第 一 步 已 经 完成 了 ， 第 二 步 应 该 如 何 解 析 HTML 呢 ?HTML 本 质 上 是 XML 的 子 集 ， 
但 是 HTML 的 语法 没有 XML 那么 严格 ， 所 以 不 能 用 标准 的 DOM 或 SAX 来 解析 HTML。 

好 在 Python 提供 了 HIMLParser 来 非常 方便 地 解析 HTML， 只 需要 简单 几 行 代码 即 可 : 

from HIMLParser Import HIMLParser 

from htmlentitydefs 1mport name2codepomt 

class MyHTMLParser(HTMLParser): 


def handle starttag(selt tag. attrs): 
print(<%%s>" % tag) 


def handle endtag(selt tag): 
pnnt( 一 9%os> % tag) 


def handle startendtag(selt tag, attrs): 
print(<%%0s/>" % tag) 


def handle data(self, data): 
print(data') 
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def handle comment(selt data): 
prnt(<!— —>) 


def handle entityreflselt, name): 
prmnt( 上 ?0s % name) 


def handle charmefselt name): 
print( &#%0s:"' % name) 


parser = MyHTIMLParser() 
parser.feed(<html><head></head><body><p>Some <a href—\"#\">html</a> 
tutonal...<br>END</p></body></honl>") 


feed0 方 法 可 以 多 次 调用 ， 也 就 是 说 ， 不 一 定 非 要 一 次 性 把 整个 HIML 字符 串 塞 进去 ， 可 
以 一 部 分 、 一 部 分 地 塞 进 去 。 

特殊 字符 有 两 种 ， 一 种 是 英文 表示 的 &nbsp;， 男 一 种 是 数字 表示 的 &#1234;， 这 两 种 字符 
都 可 以 通过 HTML Parser 解析 出 来 。 


E 到 本章 实战 


8.5.1 创建 模块 


到 目前 为 止 ， 本 章 讲 述 了 创建 模块 时 所 需 的 全 部 要 系 。 下 面 演示 的 模块 使 用 了 本 章 捅 述 的 

本 节 将 创建 meal 模块 。meal 模块 的 功能 并 不 十 分 上 庞杂， 只 是 对 一 日 三 餐 中 的 食物 和 饮料 
进行 建 模 。 

我 们 对 meal 模块 中 的 代码 刻意 做 了 简化 ， 目 的 不 是 完成 有 用 的 任务 ， 而 是 演示 如 何 组 成 
模块 。 

输入 下 面 的 代码 ， 并 将 文件 命名 为 meal.py: 


于 


创建 meal 模块 
接 看 导入 模块 ， 调 用 模块 中 的 方法 : 
makeBreakfast、makeDinner0 或 makeLunchO) 
vv 下 =[Meal,AneryChefException', 'makeBreaktast., 
IakeLunch' ‘makeDmnner'. Breakdtast, Lunch', Dinner | 
# 辅助 函数 
def makeBreakiast(): 
" 创建 一 个 Breakfast 对 象 " 
Tetum Breakifast() 


def makeLunch(): 
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"创建 一 个 Lunch 对 象 " 
Tetum Lunch() 


def makeDmner(): 
”创建 一 个 Dinner 对 象 " 
retum Dinner() 


# 异常 类 
class SensiIveArtistException(Exception): 
pass 


class AneryChefException(SensitIveArtistExXception): 
pass 


class MIeal: 

" 辟 放 食物 和 饮料 。 在 真正 面 同 对 象 的 结构 中 ， 这 个 类 包括 食物 和 饮料 的 设 定 方法 
def 1mt (selt food=omelet, drmk='coflee'): 

"初始 化 默认 值 " 

selfname = ' 普 通 餐 ， 

self.food = food 

self.drink = drink 


def printIt(selt, preflx—"): 
"格式 化 输出 "” 
print(prefix,'A tine',self.name,"with',selt.tood,'and',selt.drmk) 


# 准备 食物 
def setFood(self., food='omelei ): 
self.food = food 


# 准备 饮料 
def setDrink(self. drmk—'coffee’): 
self.drink = drink 


# 准备 名 称 
def setNamel(selt name—"): 
self.name = name 


class Breakfast(Meal): 
"为 早餐 准备 食物 和 饮料 " 
def 1mt (self): 
"前 蛋 卷 和 咖 叶 " 
Meal. mt (selt,'omelet., 'coffee'’) 
self setName(‘breakfast') 
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class Lunch(Meal): 
"午餐 的 食物 和 饮料 " 
def mt (selfb: 
"三 明治 和 杜 松子 酒 " 
Meal. Init {selt,'sandwich', ‘gn and tonlc ) 
selt.setName( midday meal') 


# 覆盖 方法 setFood(). 
def setFood(self. food=—'sandwich"): 
if food != 'sandwich' and food != ‘omelet': 
ralse AneryChefException 
Meal.setFood(self, food) 


class Dinner(Meal): 
"准备 晚餐 吃喝 " 
def Inlt (self): 
"准备 牛排 和 梅 洛 " 
Meal. mt (selt. 'steak'. merlot ) 
self.setName( dinner’) 


def printIt(selt, prefix="): 
"格式 化 输出 " 
print(prefix,A sgourmet.seltname. with .seltftfood and.seltdnnlgo 


def test(): 
"测试 方法 " 
print(Nodule meal test.") 
# 通常 没有 参数 
print( Testme Meal class.') 
m= Meal() 
m.printIt("™\t") 
m= Meal(green egps and ham', ‘tea') 
m.printIt(™"\t") 
# Test breakiast 
print( Testine Breaktast class.") 
b= Breaktast() 
b.prmntIt( 7) 


b.setName( breakine of the fast') 
b.printIt(™"\t") 

# Test dinner 

print(Testine Dinner class.') 

d= Dinner( 

d.printIt(""\t") 
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# Test hnch 
print( Testing Lunch class.) 
1= LunchO) 
1.printIt(™\t") 
print('Calling Lunch.setFood().") 
try: 
l.setFood( hotdoe’) 
except AneryChefException: 
print("t".The chet 1s anery. Pick an omelet ) 
# 如 果 模 块 作为 程序 运行 ， 就 运行 测试 
i name 一” mam “: 
test() 
meal 模块 是 根据 本 童 描述 的 技术 创建 的 ， 包 含 测试 、 文 档 、 异 常 、 类 和 函数 。 
构建 了 模块 之 后 ， 可 以 将 模块 导入 Python 脚本 中 。 例 如 ， 下 面 的 脚本 调用 了 meal 模块 中 
的 类 和 函数 : 


Import meal 


print( Makine a Breakdast) 
breakifast = meal. makeBreakiast() 


breakfast -printIt('"\t") 


print( Making a Lunch ) 
lunch = meal. makeLunch() 


try: 
lunch.setFood('pancakes’) 

except meal.AneryChefException: 
print("\t",Cannot make a lunch of pancakes.") 
print("t"."The chef ls anery. Pick an omelet.") 


这 个 例子 使 用 标准 方式 导入 模块 : 
import meal 
运行 这 个 脚本 时 ， 将 看 到 如 下 输出 : 


Makine a Breakdast 

A fine breakfast with omelet and coflee 
Making a Lunch 

Cannot make a lunch of pancakes. 

The chetf 1s anegry. Pick an omelet. 


下 一 个 脚本 演示 了 导入 模块 的 另 一 种 方法 : 


from meal 1mport * 


全 部 脚本 如 下 : 


from meal 1mport * 


print(Making a Breakdast) 
breakfast = makeBreakfast() 


breakfast.printIt("™\t") 


print(Makine a Lunch ) 
lunch = makeLunch() 


try: 
lunch.setFood('pancakes’) 


except AneryChefException: 
print("\t"."Cannot make a lanch of pancakes.") 
print(™t","The chef ls anery. Pick an omelet.") 


注意 ， 使 用 这 种 导入 形式 时 ， 不 必 使 用 模块 名 称 meal 作为 前 级 就 可 以 调用 makeLunch 和 
makeBreakfast 函数 。 
这 个 脚本 的 输出 与 上 个 脚本 的 输出 应 该 是 类 似 的 。 


Making a Breakdast 

A fine breakfast with omelet and cofiee 
Making a Lunch 

Cannot make alunch of pancakes. 

The chetf 1s angry. Pick an omelet. 


你 需要 十 分 小 心地 使 用 变量 的 名 称 。 示 例 模 块 的 名 称 是 meal， 这 意味 着 不 能 在 其 他 任何 上 
下 文中 使 用 这 个 名 称 ， 例 如 不 能 作为 变量 的 名 称 。 如 果 那 样 做 ， 就 会 覆 兰 meal 模块 的 定义 。 


8.5.2 ”安装 模块 


Python 解释 器 在 sys.path 变量 列 出 的 目录 中 查找 模块 。sys.path 变量 包括 当前 目录 ， 所 以 总 
是 可 以 使 用 当前 路 径 中 的 模块 。 然 而 ， 如 果 和 希望 在 多 个 脚本 或 系统 中 使 用 编写 的 模块 ， 那 么 需 
要 将 它们 安装 到 sys.path 变量 列 出 的 某 个 目录 中 。 

大 多 数 情况 下 ， 需 要 将 Python 模块 放 到 site-packages 目录 中 。 查 看 syspath 变量 列 出 的 目 

找到 以 site-packages 结尾 的 目录 ， 这 是 一 个 用 于 从 站 点 安装 包 的 目录 。 

需要 注意 的 是 , 除了 模块 , 还 可 以 创建 模块 的 包 , 包 是 安装 到 相同 目录 中 的 相关 模块 的 集合 。 

可 以 使 用 以 下 3 种 机 制 安装 模块 : 

e 可 以 手动 创建 安装 脚本 或 程序 。 

e 可 以 创建 针对 操作 系统 的 安装 程序 , 例如 Windows 上 的 MSI 文件 、Linux 上 的 RPM 文 
件 以 及 Mac OSX 上 的 DMG 文件 。 

e@ 可 以 使 用 便利 的 Python distutils( 代 表 distribution utility， 分 发 实用 程序 ) 包 来 创建 基于 
Python 的 安装 文件 。 
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为 使 用 Python distutils 包 ， 需 要 创建 一 个 名 为 setup.py 的 安装 脚本 。 最 简单 的 安装 脚本 可 以 
from distutils.core Imnport setup 
setup(name=NameOfModule', 

versiorn—="1.0", 


py_modules=[ NameOflModule'|, 
) 


需要 两 次 包括 模块 的 名 称 。 用 自己 的 模块 的 名 称 替 换 NameOfModule， 例 如 本 章 例 子 中 的 


meal。 


Name the script setup.py. 
创建 了 setup.py 脚本 之 后 ， 可 以 使 用 下 面 的 命令 创建 模块 的 发 布 版 本 : 
python setup.py sdist 


本 章 小 结 


本 章 将 前 几 章 的 概念 结合 在 一 起 ， 通 过 示例 深入 研究 了 如 何 创建 模块 。 模 块 就 是 选择 作为 
模块 处 理 的 Python 源 文 件 。 尽 管 听 起 来 很 简单 ， 但 是 创建 模块 时 需要 遵循 下 面 的 一 些 规则 : 

e ”为 模块 和 模块 中 的 所 有 类 、 方 法 和 函数 建立 文档 。 

e 测试 模块 并 包含 至 少 一 个 测试 函数 。 

e 定义 要 导出 模块 中 的 哪些 项 ， 包 括 哪些 类 或 函数 等 。 

e 为 使 用 模块 时 可 能 出 现 的 问题 创建 需要 的 任何 异常 类 。 

e 处 理 模块 本 喘 作 为 Python 脚本 执行 的 情况 。 

Python 使 得 在 模块 内 部 定义 类 变 得 非常 容易 。 

开发 模块 时 ， 可 以 分 别 使 用 help 和 reload 函数 显示 模块 的 文档 以 及 重新 加 载 改 变 的 模块 。 

创建 了 模块 之 后 , 可 以 使 用 Python distutils 包 创 建 该 模块 的 发 布 包 , 为 此 , 需要 创建 setup.py 
脚本 。 


思考 与 练习 


1. 如 何 访问 模块 提供 的 功能 ? 

2. 如 何 控制 模块 的 哪些 项 是 公有 的 (公有 项 在 其 他 Python 脚本 中 是 可 用 的 )? 
3. 如 何 查 看 模块 的 文档 ? 

4. 如 何 找 出 系统 中 安装 了 哪些 模块 ? 

5. 什么 类 型 的 Python 命令 能 放 到 模块 中 ? 
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异常 处 理 和 程序 调试 


作为 Python 初学 者 ， 在 刚刚 学 习 Python 编程 时 ， 经 常会 看 到 一 些 报错 信息 。 这 些 报错 信 
息 包 括 : 有 的 错误 是 程序 编写 有 问题 造成 的 ， 比 如 本 来 应 该 输出 整数 却 输出 了 字符 串 ， 这 种 错 
误 我 们 通常 称 为 bug，bug 是 必须 修复 的 ; 有 的 错误 是 用 户 输入 造成 的 ， 比 如 让 用 户 输入 电子 邮 
箱 地 址 ， 结 果 得 到 一 个 空 的 字符 串 ， 这 种 错误 可 以 通过 检查 用 户 输入 来 做 相应 的 处 理 ， 还 有 一 
类 错误 是 完全 无 法 在 程序 运行 过 程 中 预测 的 ， 比 如 写 入 文件 的 时 候 ， 磁 盘 满 了 ， 写 不 进去 ， 或 
者 从 网 络 抓 取 数据 ， 网 络 突然 断 了 。 这 类 错误 也 称 为 异常 ， 在 程序 中 通常 也 是 必须 处 理 的 ， 否 
则 ， 程 序 会 因为 各 种 问题 终止 并 退出 。 

Python 内 置 了 一 套 异 第 处 理 机 制 来 帮助 我 们 进行 错误 处 理 。 

此 外 ， 还 需要 跟踪 程序 的 执行 ， 查 看 变量 的 值 是 否 正确 ， 这 个 过 程 称 为 调试 。Python 中 的 
pdb 可 以 让 我 们 以 单 步 方式 执行 代码 。 

最 后 ， 编 写 测 试 也 很 重要 。 有 了 良好 的 测试 ， 就 可 以 在 程序 修改 后 反复 运行 ， 确 保 程序 输 
出 符合 我 们 编写 的 测试 。 

本 章 就 来 详细 介绍 错误 和 异常 的 处 理 ， 以 及 测试 的 编写 与 运行 。 


本 章 的 学 习 目 标 : 

了 解 Python 中 的 两 种 错误 (语法 错误 和 异常 ) 及 其 区 别 ; 
了 解 第 用 的 内 置 异常 以 及 异常 继承 关系 ; 

掌握 异常 的 处 理 方法 try...catch...finally..….; 

掌握 raise 语句 主动 抛 出 异常 的 方式 : 

掌握 异常 的 追踪 及 记录 ; 

掌握 常用 的 程序 调试 方法 ; 

了 解 测试 的 编写 和 运行 方法 。 


EW 异常 


调试 Python 程序 时 ， 经 常会 报 出 一 些 异 贡 ， 产 生 异 弟 的 原因 有 两 个 方面 。 一 方面 ， 可 能 是 
写 程序 时 由 于 玻 忽 或 考虑 不 全 造成 了 错误 , 这 时 就 需要 根据 异常 退 踊 到 出 错 点 , 进行 分 析 改 下 ; 


另 一 方面 ， 有 些 异常 是 不 可 避免 的 ， 但 可 以 对 异常 进行 捕获 处 理 ， 防 止 程序 终止 。 
9.1.1 错误 与 异常 的 概念 


错误 无 法 通过 其 他 代码 进行 处 理 , 如 语法 错误 和 逻辑 错误 。 语法 错误 是 单词 或 格式 等 写 错 ， 
只 能 根据 系统 提示 去 修改 相应 的 代码 。 逻辑 错误 是 代码 实现 功能 的 逻辑 有 问题 ,， 系统 不 会 报销 ， 
只 能 找到 相应 的 代码 进行 修改 。 

异常 是 程序 执行 过 程 中 出 现 的 未 知 问题 ， 这 里 语法 和 逻辑 都 是 正确 的 ， 可 以 通过 其 他 代码 
进行 处 理 修复 ， 比 如 可 以 通过 站 判定 语句 来 避免 对 年 龄 进行 赋值 时 因 输 入 字符 而 出 现 异 第 的 情 
况 ， 使 用 捕捉 异常 可 以 避免 除 零 异常 ， 等 等 。 

常见 的 系统 异常 如 下 。 
除 零 异 常 (ZeroDivisionErronD: 被 除数 写成 了 0。 
名 称 异 种 (NameErron): 变量 未 定义 。 
类 型 异常 (TypeErronD: 对 不 同类 型 的 数据 进行 相 加 。 
索引 异 弟 (ndexEron: 超出 索引 范围 。 
键 异 和 (长 eyErronD: 没有 对 应 名 称 的 键 。 
值 异常 (ValueError): 将 字符 型 数据 转换 成 整 型 数据 。 
属性 异 第 (AttributeError): 对 象 没有 对 应 名 称 的 属性 。 
夺 代 右 异 第 (StopIteration): 迭代 次 数 超出 迭代 器 中 元 素 的 个 数 。 


9.1.2 Python 内 置 异 常 


Python 的 异常 处 理 能 力 是 很 强大 的 ， 它 有 很 多 内 置 异常 ， 可 同 用 户 准 确 反 馈 出错 人 信息。 在 
Python 中 ， 异 第 也 是 对 象 ， 可 对 它们 进行 操作 。BaseException 是 所 有 内 置 异常 的 基 类 ,但 用 户 
定义 的 类 并 不 直接 继承 BaseException， 有 所 有 的 异常 类 都 从 Exception 继承 ， 且 都 在 exceptions 
模块 中 定义 。Python 上 自动 将 所 有 异常 名 称 放 在 内 建 的 命名 称 空间 中 ， 所 以 程序 不 必 导 入 
exceptions 模块 即 可 使 用 异常 。 一 旦 引发 并 且 没 有 捕捉 SystemExit 异常 ， 程 序 执行 就 会 终止 。 
如 果 交 互 式 会 话 遇 到 未 被 捕捉 的 SystemExit 异常 ， 会 话 就 会 终止 。 

内 置 异常 类 的 层次 结构 如 下 : 


BaseException # 所 有 异常 的 基 类 
+-- SystemExit # 解释 器 请 求 退出 
+-- KeyboardInterrupt # 用 户 中 断 执 行 (通常 是 输入 ^C) 
+- GeneratorExit # 生成 器 (generator) 发 生 异 常 来 通知 退出 
+-- Exception # 常规 异常 的 基 类 


+-- StopIteration # 进 代 器 没有 更 多 的 元 素 可 供 友 代 

+-- StopAsyncIteration # 必须 通过 异步 迭代 器 对 象 的 _anext 0 方法 来 停止 从 代 
+-- ArithmeticError ” # 各 种 算术 错误 引发 的 内 置 异常 的 基 类 

| “十 - FloatinePointError  # 浮 点 计算 错误 

| + OverflowError # 数值 运算 结果 太 大 ， 无 法 表示 

| “+-ZeroDivisionFErmor ”# 除 ( 或 取 模 ) 零 (所 有 数据 类 型 ) 


+-- AssertionError # 当 asseit 语句 失败 时 引发 
+-- AttributeError # 属性 引用 或 赋值 失败 
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+-- BufferError ”# 无 法 执行 与 缓冲 区 相关 的 操作 时 引发 

+-EOFEmor 。 # 当 input 函数 在 没有 读 取 任何 数据 的 情况 下 到 达 文 件 结束 条 件 (EOF) 时 引发 
+-- ImportEmror ”# 导入 模块 /对 象 失败 

| +- ModuleNotFoundError  # 无 法 找到 模块 或 在 sys.modules 中 找到 None 


+-- LookupError # 映射 或 序列 上 使 用 的 键 或 索引 无 效 时 引发 的 异常 的 基 类 

| ++- IndexError # 序列 中 没有 此 索引 (index) 

| +- KeyEror # 映射 中 没有 这 个 键 

+-- MemoryError # 内 存 洲 出 错误 (对 于 Python 解释 器 不 是 致命 的 ) 

+-- NameError # 未 声明 /初始 化 对 象 (没有 属性 ) 

| + UnboundLocalError # 访问 未 初始 化 的 本 地 变量 

+-- OSEIrror # 操作 系统 错误 ，EnvironmentEmor、IOErmor、WindowsError、 

# socket.error、select.error 和 mmap.error 已 合并 到 OSErmor 中 ， 构 造 函 数 可 能 返回 子 类 

+-- BlockineIOError # 操作 将 阻塞 对 象 (e.g. sockeb 设 置 为 非 阻 塞 操作 
+-- ChildProcessError # 子 进程 上 的 操作 失败 
+-- ConnectionEITOT # 与 连接 相关 的 异常 的 基 类 


| ”| +-- BrokenPipeError # 另 一 端 关 闭 时 符 试 写 入 管道 或 试图 在 已 天 财 写 入 的 套 接 字 上 与 入 

| “1 ”+-ConnectionAbortedEmor # 连接 尝试 被 对 等 方 中 止 

| | +-- ConnectionRefusedError # 连接 尝试 被 对 等 方 拒绝 

| ”| +- ConnectionResetError  # 连接 由 对 等 方 重 置 

| +-- FileExistsError # 创建 已 存在 的 文件 或 目录 

| +-- FileNotFoundE1ror # 请 求 不 存在 的 文件 或 目录 

| ”+-InteruptedEmor # 系统 调用 被 输入 信和 号 中 断 

+-- IsADIirectoryError # 在 目录 上 请 求 文件 操作 (例如 os.remove0) 

| ”+- NotADirectoryError “ # 在 不 是 目录 的 事物 上 请 求 目 录 操 作 ( 例 如 os.listdirO0) 

| +-- PermissionEIrror # 尝试 在 没有 足够 访问 权限 的 情况 下 执行 操作 

| “十 - ProcessLookupError ”# 给 定 进程 不 存在 

| “+-TimeoutErmor # 系统 国 数 在 系统 级 别 超时 

+-- ReferenceError 并 Weakrefproxy 国 数 创建 的 弱 引 用 试图 访问 己 被 垃圾 回收 的 对 象 

+-- RuntimeError ” # 在 检测 到 不 属于 任何 其 他 类 别 的 错误 时 触 皮 

| “+-- NotImplementedError # 在 用 户 定 义 的 基 类 中 ， 抽 象 方法 要 求 派 生 类 重 写 该 方法 ， 或 者 正 
# 在 并 开发 的 类 指示 仍然 需要 添加 实际 实现 


| +- RecursionError # 解释 器 检测 到 超出 最 大 递归 深度 
+-- SyntaxError # Python 语法 错误 

| ”+-IndentationEITOT # 缩 进 错误 

| +-- TabError #Tab 和 空格 混用 


+-- SystemEror  ## 解释 器 发 现 内 部 错误 
+-- TypeError # 操作 或 函数 被 应 用 于 不 适当 类 型 的 对 象 
+-- ValueError 六 操作 或 函数 接收 到 具有 正确 类 型 但 值 不 合适 的 参数 
| +-UnicodeEmor # 发 生 与 Unicode 相关 的 编码 或 解码 错误 
+--UnicodeDecodeErmor ”#Unicode 解码 错误 
二 - UnicodeEncodeError ”#Unicode 编码 错误 
| 十 -- UnicodeTranslateError # Unicode 转 码 错误 
+ Wammg # 警告 的 基 类 
+-- DeprecationVWaming # 有 关 已 弃 用 功能 的 警告 的 基 类 
+- PendingDeprecationWaming# 有 关 不 推荐 使 用 功能 的 警告 的 基 类 
+-- RuntimeWamine # 有 关 可 颖 的 运行 时 行为 的 警告 的 基 类 
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+- SyntaxWaming # 关于 可 疑 语 法 警告 的 基 类 

+-- UserWaming # 用 户 代码 生成 警告 的 基 类 

+-- FutureWaming # 有 头 已 弃 用 功能 的 警告 的 基 类 

+-- InportWaming # 关于 导入 模块 时 可 能 出 错 的 警告 的 基 类 

+- UnicodeWaming  # 与 Unicode 相关 的 警告 的 基 类 

+-- BytesWaming # 与 byte 和 bytearray 相关 的 警告 的 基 类 

+-- ResourceWaming  # 与 资源 使 用 相关 的 警告 的 基 类 ， 被 默认 警告 过 滤器 忽略 


9.1.3 ”requests 模块 的 相关 异常 
在 做 网 络 息 虫 时 ，requests 是 一 个 十 分 好 用 的 模块 ， 这 里 专门 探讨 一 下 requests 模块 的 相关 


天 二 


例如 ; 


要 调用 requests 模块 的 内 置 异常 ， 只 要 使 用 “from requests.exceptions import XxX” 束 可 以 了 ， 


from requests.exceptions Import ConnectionError, ReadTrmeout 
写成 以 下 方式 也 可 以 : 


from requests mport ConnectionError, ReadTIimeout 
requests 模块 的 内 置 异常 类 的 层次 结构 如 下 : 


IOF1ror 
+-- RequestException ”# 处 理 不 确定 的 异常 请 求 
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+-- HTIPEror “ #HTTP 错误 

+-- ConnectionFEiror ” # 连接 错误 

| ”+-ProxyEror ”# 代理 错误 

| +-SSLEmor # SSL 错误 

| “十 - ConnectTimeout(+- -Timeout) #( 双 重 继 承 ， 余 同 ) 尝 试 连 接 到 远程 服务 器 时 请 求 超时 ， 
# 产 生 此 错误 的 请 求 可 以 安全 地 重 试 

+-- Timeout # 请 求 超时 

| “+-ReadTimeout # 服务 器 未 在 指定 的 时 间 内 发 送 任何 数据 

+-- URLRequired # 发 出 请 求 需要 有 效 的 URL 

+-- TooManyRedirects ## 重 定向 太 多 

+-- MissingSchema(+-- ValueError) ”# 缺少 URL 架构 (例如 HITP 或 HITPS) 

+-- InvalidSchema(+-- ValueError) ”# 无 效 的 架构 ， 有 效 架 构 请 参见 defaults.py 

+-- InvalidURL(+-- ValueEror) # 无 效 的 URL 


| + InvahdProxyURL # 无 效 的 代理 URL 

+-- InvalidHeader(+-- ValueError) ” # 无 效 的 Header 

+-- ChunkedEncodingError # 服务 器 声明 了 chunked 编码 ， 但 发 送 了 无 效 的 chunk 

+-- ContentDecodingError(+-- BaseHTTPError) # 无 法 解码 响应 内 容 

+-- StreamConsumedError(+-- TypeError) # 啊 应 的 内 容 已 被 使 用 

+-- RetryError # 上 自 定义 重 试 逻 辑 失 败 

+-- UnrewindableBodyError 答 试 倒 回 正文 时 ， 请 求 遇 到 错误 

+-- FileModeWaming(+-- DeprecationWarning) # 文件 以 文本 模式 打开 , 但 requests 确定 的 是 二 进 制 
# 长 度 
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+--RequestsDependencyWaming # 导入 的 依赖 项 与 预期 的 版 本 范围 不 匹配 


Warnme 
+-- RequestsWaming # 请 求 的 基本 警告 


下 面 的 程序 展示 了 Python 内 置 的 ConnectionError 异常 ,这 里 不 用 再 从 requests 模块 导入 了 : 


lmDpoit requests 
from requests mport ReadIImeonut 


det get page(url): 
try: 
response = requests.eet(url, tmeout=1) 
i{ response.status code 一 200: 
return response.text 
else: 
print(Get Page Falled', response.status code) 
retum None 
except (ConnectionError. ReadTimeout): 
print(Crawlne Failed', url) 
retum None 


def mam(): 
Url = https:/Wwww.baidu.com 
print(get page(url)) 


9.1.4 ”用户 自 定 义 异 常 


此 外 ， 虽 然 Python 提供 了 丰富 的 内 置 异常 类 , 但 由 于 实际 的 项 目 都 有 各 自 的 业务 背景 ，4 
多 时 候 内 置 异 常 类 无 法 完全 满足 业务 需要 。 为 此 ，Python 允许 用 户 自 定义 异常 。 用 户 可 以 通过 


class MVEITOTUEXceptiony: 
def mt (selt mse): 
seltImsg = msg 


def str (self): 
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创建 新 的 异常 类 拥有 目 己 的 异 弟 ,用户 目 定义 异 第 时 应 该 通过 直接 或 间接 的 方式 继承 Exception 
类 。 下 面 创 建 了 MyError 类 ， 基 类 为 Exceptionp， 用 于 在 触发 异常 时 输出 更 多 的 信息 。 
在 try 语句 块 中 ， 抛 出 用 户 自 定义 异常 后 执行 except 部 分 ， 变 量 e 是 用 于 创建 MyError 类 
的 实例 。 示 例如 下 : 


Tetull self.mse 


try: 
raise MyError( 类 型 错误 ") 

except MYVYEITOT as e: 
print(My exception occurred', e.mse) 


当 发 生 异 常 时 ， 需 要 对 异常 进行 捕获 ， 然 后 进行 相应 的 处 理 。 进 行 异常 捕获 需要 使 用 
try...except .结构 ， 把 可 能 发 生 错 误 的 语句 放 在 try 语句 块 中 ， 用 except 处 理 异常 ， 每 一 个 try， 
都 必须 至 少 对 应 一 个 except。 此 外 ， 与 Python 异常 相关 的 关键 字 如 表 9-1 所 示 。 


表 91 与 Python 异常 相关 的 关键 字 


关键 子 关键 字 说 明 
try/except 捕获 异常 并 处 理 
jass 忽略 异 季 
as 定义 异常 实例 (except MyError as 日 
else 如 果 try 中 的 语句 没有 引发 异常 ， 则 执行 else 中 的 语句 
finall 无 论 是 否 出 现 异 币 都 执行 的 代码 
Taise 抛 出 /引发 异 第 


异常 捕获 有 很 多 方式 ， 下 面 分 别 进行 讨论 。 
9.2.1 捕获 所 有 异常 


捕获 所有 异 币 ， 包 括 键盘 中 断 和 程序 退出 请 求 (用 sys.exit0 就 无 法 退出 程序 了， 因为 异常 1 
捕获 了 )， 因 此 慎 用 。 语 法 格式 如 下 : 


try: 
< 语句 > 
except: 
print( 异 和 常 说 明 ") 


9.2.2 ”捕获 指定 卉 党 
可 以 捕获 指定 的 异常 。 语 法 格式 如 下 : 
try: 
< 语句 > 
except 一 异 名 名 >: 
print( 异 常 说 明 ") 


示例 如 下 : 


138 


第 9 章 异常 处 理 和 程序 调试 


try: 
t= open("file-not-exists", "r") 
except IJOEITOT as e: 
print("open exception: %os: %s" %o(e.errno, e.StreITOT)) 


捕获 任意 异 弟 ， 语 法 格式 如 下 : 


try: 
< 语句 ]> 
except Exception: 
print( 异 常 说 明 ") 


9.2.3 捕获 多 个 异常 


捕获 多 个 异常 有 两 种 方式 。 第 一 种 是 一 个 except 同时 处 理 多 个 异常 ， 不 区 分 优先 级 ， 语 法 
格式 如 下 : 


try: 
< 语 颁 >> 
except (< 异常 名 1>, < 异常 名 2>, ...): 
print( 异 常 说 明 '") 
第 二 种 是 区 分 优先 级 的 ， 语 法 格式 如 下 : 
try: 
< 语 休 > 
except < 异常 名 1>: 
print( 寞 常 说 明 1") 
except < 异常 名 2>: 
print( 异 常 说 明 2') 
except < 异常 名 3>: 
print( 异 常 说明 3") 


这 种 异常 处 理 语法 的 规则 是 : 

e 执行 try 中 的 语句 ， 如 果 引 发 异 剃 ， 则 执行 过 程 会 跳 到 第 一 个 except 语句 。 

e 如 果 第 一 个 except 中 和 定义 的 异 帝 与 引发 的 异 营 匹配 ， 则 执行 该 except 中 的 语句 。 

se 如果 引发 的 异 弟 不 匹配 第 一 个 except， 就 搜索 第 二 个 except， 人 允许 编写 的 except 数量 不 
受 限制 。 

e 如果 所 有 的 except 都 不 匹配 ， 则 异常 会 被 传递 到 下 一 个 调用 该 代码 的 最 高 层 try 中 。 


9.2.4 异常 中 的 else 


判断 完 没 有 某 些 异常 之 后 ， 如 果 还 想 做 其 他 事 ， 就 可 以 使 用 下 面 这 样 的 else 语句。 语法 格 
式 如 下 : 


try: 
< 语 全 ]> 
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except< 寞 币 名 1>: 
print( 异 常 说 明 1) 
except < 卉 常 名 2>: 
print( 异 常 说 明 2) 
else: 
< 语句 > #try 语句 中 没有 异常 ， 则 执行 此 段 代码 


9.2.5 ”异常 中 的 finally 
对 于 try..finally.. 语 句 ， 无 论 是 否 发 生 异 常 都 将 会 执行 最 后 的 代码 。 语 法 格式 如 下 ; 
try: 
< 语句 > 
finally: 
< 语句 > 


示例 程序 如 下 : 


strl = hello world' 

try: 
nt(strl1) 

except IndexEITOT as e: 
prnt(e) 

except keyEITOT as e: 
print(e) 

except ValueEITOT as e: 
print(e) 

else: 
print(try 内 没有 异常") 

finally: 加 
print( 无 论 及 生 腊 第 与 否 ， 都 会 执行 我 ) 


9.2.6 ”使 用 raise 语句 主动 抛 出 异常 
可 以 使 用 raise 语句 主动 抛 出 异常 ， 语 法 格式 如 下 : 


raise [Exception [, args [, traceback]]] 


Exception 表示 异常 的 类 型 (例如 ValueError); args 参数 是 可 选 的 ， 是 异常 的 参数 ， 如 果 不 提 
供 ， 异 常 的 参数 是 "None"; 最 后 一 个 参数 traceback 表示 异常 跟踪 对 象 ， 也 是 可 选 的 (在 实践 中 
很 少 使 用 )。 示 例 程序 如 下 : 


det not zero(num): 


try: 
[num 一 (0: 
raise ValueError( 参 数 错误 ") 
retum num 
except Exception as e: 
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print(e) 
not zero(0) 


异 弟 是 类 ， 捕 获 异 常 就 是 捕获 类 的 实例 。 因 此 ， 异 常 并 不 是 任 空 产生 的 ， 而 是 有 意 创建 并 
抛 出 的 。Python 的 内 置 函数 会 抛 出 很 多 类 型 的 异常 ， 我 们 自己 编写 的 函数 也 可 以 抛 出 异常 。 
如 果 要 抛 出 异 六 ， 可 以 首先 根据 需要 ， 定 义 异 着 类 ， 选 择 好 继承 关系 ， 然 后 使 用 raise 语句 
抛 出 异常 类 的 实例 : 
#f eT.py 
class FooError(StandardError): 
pass 


def foo(s): 
n= mt(s) 
if n—0: 
ralse FooError( nvalid value: %s' % s) 
retum 10 7 


执行 ， 可 以 最 后 跟 踊 到 定义 的 异常 : 


$ python err.py 
Traceback (most recent call last): 


_ mam .FooEror: Invalld value: 0 


只 有 在 必要 的 时 候 才 定义 异 第 类 。 如 果 可 以 选择 Python 己 有 的 内 置 异常 类 (比如 ValueError、 
TypeError)， 就 尽量 使 用 Python 的 内 置 异常 类 。 
最 后 ， 我 们 来 看 另 一 种 异常 处 理 方式 : 


# er.py 

def foo(s): 
n= nt(s) 
retum 10/n 


def bar(s): 
try: 
retum foo(s) * 2 
except StandardError, e: 
print (Error!') 
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在 bar 函数 中 , 我 们 明明 已 经 捕获 了 异常 。 但 是 , 打印 输出 “Eror!” 后 ， 义 把 异常 通过 raise 
语句 抛 出 去 了 。 

其 实 这 种 错误 处 理 方式 不 但 没有 问题 ， 而 且 相 当 常 见 。 捕 获 异 常 目 的 只 是 记录 一 下 ， 便 于 
后 续 追 踪 。 但 是 ， 由 于 当前 函数 不 知道 应 该 怎么 处 理 异常 ， 因 此 最 恰当 的 方式 是 继续 往 上 抛 ， 
让 顶层 调用 者 去 处 理 。 

raise 语句 如 果 不 市 参数 ， 就 会 把 当前 异常 原样 抛 出 。 此 外 ， 还 可 以 把 一 种 类 型 的 异常 转换 
成 另 一 种 类 型 : 

try: 
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except ZeroDIVISIOnEITOT: 
ralse ValueError( mput error!) 


只 要 转换 逻辑 合理 就 可 以 ， 但 是 ， 绝 不 应 该 把 IOError 转换 成 党 不 相干 的 ValueError。 
9.2.7 ”使 用 traceback 模块 查看 异常 


发 生 异 第 时 ，Python 能 “ 记 住 ”引发 的 异常 以 及 程序 的 当前 状态 。Python 还 维护 着 跟踪 对 
象 ， 其 中 含有 异常 发 生 时 与 函数 调用 堆栈 有 关 的 信息 。 记 住 ， 异 常 可 能 在 一 系列 区 套 较 深 的 函 
数 调用 中 引发 。 程 序 调用 每 个 函数 时 ，Python 会 在 “函数 调用 堆栈 ”的 起 始 处 插入 函数 名 。 一 
日 异常 被 引发 ，Python 就 会 搜索 相应 的 异常 处 理 程序 。 如 果 当 前 函数 中 没有 异常 处 理 程序 ， 当 
前 图 数 会 终止 执行 ，Python 会 搜索 当前 函数 的 调用 函数 ， 并 以 此 类 推 ， 直 到 发 现 匹 配 的 异常 处 
理 程序 ， 或 者 Python 抵达 主 程序 为 止 。 这 一 查找 合适 的 异常 处 理 程序 的 过 程 就 称 为 “堆栈 轰 转 
开 解 ”(Stack Unwinding)。 解 释 器 一 方面 维护 着 与 放置 于 堆栈 中 的 函数 有 关 的 信息 ， 男 一 方面 
也 维护 着 与 已 从 堆栈 中 “ 轧 转 开 解 ”(Unwinding) 的 函数 有 关 的 信息 。 

语法 格式 如 下 : 


try: 
block 

except: 
traceback .print exc() 


示例 程序 如 下 : 


try: 
1/0 
except Exception as e: 
print(e) 
如 果 这 样 写 ， 程 序 只 会 报 “division by zero”( 除 零 ) 错 误 ， 但 是 并 不 知道 是 在 哪个 文件 以 及 
哪个 函数 的 哪 一 行 出 了 错 。 下 面 使 用 traceback 模块 ， 示 例 程 序 如 下 : 


1mport traceback 


1/0 
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except Exception as e: 
traceback.prmt exc() 


这 样 可 以 帮助 我 们 人 奶 调 到 出 错位 置 : 


Traceback (most Tecent call last): 
File "E:/PycharmProjects/ProxyPool-master/proxypool/test.py", line 4. m <module> 
1/0 
ZeroDIVISIOnEITOT division by zero 


另外 ，tracebackprint exc0 跟 traceback.format excO0 有 什么 区 别 呢 ? 

区 别 就 是 ，traceback format exc0 返 回 字 符 串 ，tracebackprint excO 则 直接 打印 出 来 。 
traceback print exc() 与 print(traceback format excO) 的 效果 是 一 样 的 。print exc0 还 可 以 接收 file 
参数 ， 直 接 写 入 一 个 文件 中 。 比 如 ， 可 以 像 下 面 这 样 把 相关 信息 写 入 也 .txt 文件 中 。 


traceback.print exc(file=open( tb.txt,"Ww+")) 


ER 程序 调试 


9.3.1 调试 


程序 能 一 次 写 完 并 正常 运行 的 概率 很 小 ， 基 本 不 超过 1%。 总 会 有 各 种 各 样 的 bug 需要 修 
正 。 有 的 bug 很 简单 ， 看 看 错误 信息 就 知道 ， 有 的 bug 很 复杂 ， 我 们 需要 知道 出 错时 ， 哪 些 变 
量 的 值 是 正确 的 ， 哪 些 变量 的 值 是 错误 的 。 因 此 ， 需 要 有 一 整套 调试 程序 的 手段 来 修复 bug。 
第 一 种 方法 简单 、 直 接 且 有 效 ， 就 是 用 print 函数 把 可 能 有 问题 的 变量 打印 出 来 : 
# ert.py 
def foo(s): 
n= mt(s) 
prnt >>> n= %d %n 
retum 10/n 


执行 后 ， 在 输出 结 采 中 查找 打印 的 变量 值 : 
$ python err.py 
>>>n=0 


Traceback (most recent call last): 


ZeroDIVIsSIonEITOT nteger division or modulo by zero 
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使 用 print 函数 的 最 大 坏处 是 将 来 还 得 删 反 它们， 人 否则 程序 里 到 处 都 是 print 函数 ， 运 行 结 
果 也 会 包含 很 多 垃圾 信息 。 


9.3.2 断言 
凡是 使 用 print 函数 辅助 查看 的 地 方 ， 都 可 以 用 断言 (asserb 来 蔡 代 : 
并 EITDY 
def foo(s): 
n= 1nt(s) 
assertn != 0, n 1s Zero!' 
Tetum 10/n 
def mam(): 
foo('0") 
asseit 的 意思 是 ， 表 达 式 n !=0 应 该 是 Tme， 否 则 ， 后 面 的 代码 就 会 出 错 。 
如 果断 言 失败 ，assert 语句 本 吴 就 会 抛 出 AssertionError 异 芝 : 
$ python err.py 
Traceback (most recent call last): 
pr n 1s zerol 
程序 中 如 果 到 处 充斥 着 assert， 和 使 用 print 函数 相 比 也 好 不 到 哪里 去 。 不 过 ， 启 动 Python 
解释 器 时 可 以 用 -O 参数 关闭 asselt: 


$ python -O err.py 
Traceback (most recent call last): 


ea mteger division or modulo by zero 

关闭 后 ， 就 可 以 把 所 有 的 assert 当成 pass 看 。 
9.3.3 logging 

把 print 函数 蔡 换 为 logging 是 第 3 种 方式 ， 和 assert 相 比 ，logging 不 会 抛 出 错误 ， 而 且 可 
以 输出 到 文件 中 : 

# errpy 

import logeing 


s= 0 

n= nt(s) 

logeme.mfto(n 三 9%od % n) 
prnt 10/n 


logging.info0 就 可 以 轩 出 一 段 文本 。 运 行 ， 发现 除了 ZeroDivisionEmror， 没 有 任何 信息 。 怎 
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么 回 事 ? 
Imbport logeme 
logeing.basicConfie(level=logeme.mfo) 
输出 如 下 : 
$ python err.py 
INFO:root:n=0 
Traceback(most recent call last): 
File “err.py", line 8. In <module> 
print 10/n 


ZeroDIVIsIonEITOT nteger division or modulo by zero 


这 就 是 logging 的 好 处 ， 它 允许 指定 记录 信息 的 级 别 ， 有 debug、info、warning、error 等 几 
个 级 别 ， 当 我 们 指定 info 时 ，debug 束 不 起 作用 了 。 同 理 ， 指 定 waming 后 ，debug 和 info 就 不 
起 作用 了 。 这 样 一 来 ， 怠 可 以 放心 地 得 出 不 同 级 别 的 信息 ， 也 不 用 删除 ， 最 后 统一 控制 输出 哪 
个 级 别 的 信息 。 

logging 的 男 一 个 好 处 是 ， 通 过 简单 的 配置 ,一 条 语句 可 以 同时 输出 到 不 同 的 地 方 ， 比 如 控 
制 台 和 文件 。 


9.3.4 pdb 


第 4 种 方式 是 启动 Python 的 pdb 调试 器 , 让 程序 以 单 步 方式 运行 , 可 以 随时 查看 运行 状态 。 
我 们 先 准备 好 程序 : 

#f eIT.pY 

s=0 

n= nt(s) 

prmt 10/n 


然后 局 动 : 


$ python -m pdb err.py 
> /Users/michael'Github/sicp/err.py(2)<module>() 
-> S 三 '0 


以 参数 -m pdb 启动 后 ，pdb 定位 到 下 一 步 要 执行 的 代码 “-> s= '0”。 输 入 命令 1 来 查看 


(Pdb) 
| # err.py 
2 二 s='0 
3 n= mt(s) 
4 print 10 /nn 
[EOF] 
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输入 命令 n 可 以 单 步 执行 代码 : 


(Pdb)a 
> /Users/michael/Github/sicp/err.py(3)=module>() 
-> 二 Int(s) 
(Pdb)n 
> /Users/michael'Github/sicp/err.py(4)<module>() 
print 10/n 


任何 时 候 都 可 以 输入 命令 “p 苔 和 鲁 各 ”来 坦 看 变量 : 


(Pdb)ps 
'0 
(Pdb) pn 
0 


输入 命令 q 结束 调试 ， 退 出 程序 : 


(Pdb)n 
ZeroDIVISIOnEITOT "nteger division or modulo by zero' 
> /Users/michael/Github/sicp/err.py(4)<module>() 
print 10/n 
(Pdb)q 


这 种 通过 pdb 在 命令 行进 行 调试 的 方法 ， 在 理论 上 是 万 能 的 ， 但 实在 是 太 麻烦 了 ， 如 果 有 


1000 行 代码 ， 工 作 量 太 小 了 。 还 好 ， 我 们 还 有 男 一 种 调试 方法 。 
9.3.5 pdb.set tracel() 


这 种 方法 虽然 仍 使 用 pdb,， 但 是 不 需要 单 步 执行 ,我们 只 青 要 导入 pdb。 然 后 ， 在 可 能 出 错 


的 地 方 放 上 pdb.set trace0， 就 可 以 设置 断 点 : 


并 ETTPY 


s= 0 

n= nt(s) 

pdb.set trace() # 运行 到 这 里 会 自动 暂停 

print 10/n 

运行 代码 ， 程 序 会 目 动 在 pdb.set trace0 处 暂停 并 进入 pdb 调试 环境 ， 可 以 用 命令 p 查看 变 
或 者 用 命令 c 继续 运行 : 

$ python err.py 

> /Users/michael'Github/sicp/err.py(7)<module>() 

> print 10/n 

(Pdb)pn 
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Traceback (most recent call last): 
File "errpy", Ine 7, In <module> 
print 10/n 
ZeroDIVIsIonEITOT mteger division or modulo by zero 
这 相 比 直接 局 动 pdb 进行 单 步调 试 ， 效 率 要 高 出 很 多 。 
9.3.6 IDE 


如 果 想 要 快速 地 设置 断 点 、 单 步 执行 ， 束 需要 文 持 调试 功 能 的 IDE。 有 目前 比较 好 的 Python 
IDE 有 PyCharm。 另 外 ， 为 Eclipse 添加 pydev 插件 也 可 以 调试 Python 程序 。 

写 程序 最 痛 苗 的 事情 莫 过 于 调试 ， 程 序 往往 会 以 意 想 不 到 的 流程 运行 ， 期 待 执 行 的 语句 其 
实 根本 没有 执行 ， 这 时 候 ， 就 需要 进行 调试 了 。 虽 然 用 IDE 调试 起 来 比较 方便 ， 但 是 最 后 你 会 
用 现 ，logging 才 是 终极 武 融 。 


EI 单元 测试 


如 果 听 说 过 “测试 驱动 开发 ”(TDD，TestDriven DevelopmenbD， 单 元 测试 就 不 陌生 。 
9.4.1 单元 测试 

单元 测试 用 来 对 模块 、 函 数 或 类 进行 正确 性 检验 。 比 如 对 于 函数 abs0， 我 们 可 以 编写 出 以 
下 几 个 测试 用 例 : 

e 输入 正 数 ， 比 如 1、1.2、0.99， 期 待 返回 值 与 输入 相同 。 

e 输入 负数 ， 比 如 -1、- 12、- 0.99， 期 待 返回 值 与 输入 相反 。 

6 

加 


输入 0， 期 竺 返回 0。 
输入 非 数值 类 型 ， 比 如 None、[]、 分 ， 期 待 抛 出 TypeErmor。 
把 上 面 的 测试 用 例 放 到 一 个 测试 模块 里 ， 融 是 一 个 完整 的 单元 测试 。 
如 果 单 元 测试 通过 ， 说 明 我 们 测试 的 这 个 函数 能 够 正常 工作 。 如 果 单 元 测试 不 通过 ， 要 人 么 
函数 有 bug， 要 么 测试 条 件 输入 不 正确 。 总 之 ， 需 要 修复 使 单元 测试 能 够 通过 。 
单元 测试 通过 后 有 什么 意义 昵 ? 如 果 我 们 对 abs0 函 数 做 了 修改 ,， 只 需要 再 执行 一 遍 单 元 测 
试 。 如 果 通 过 ， 说 明 修 改 不 会 对 abs0 函 数 原 有 的 行为 造成 影响 。 如 果 测 试 不 通过 ， 说 明 修 改 与 
原 有 行为 不 一 致 ， 要 么 修改 代码 ， 要 么 修改 测试 。 
这 种 以 测试 为 驱动 的 开发 模式 ， 最 大 的 好 处 就 是 确保 程序 模块 的 行为 符合 我 们 设计 的 测试 
用 例 。 在 将 来 修改 的 时 候 ， 可 以 极 大 程度 上 保证 模块 行为 仍然 是 正确 的 。 
我 们 来 编写 Dict 类 ， 这 个 类 的 行为 和 字典 一 致 ， 但 是 可 以 通过 属性 来 访问 ， 用 起 来 束 像 下 
面 这 样 : 
>>> d= Dict(a=]1, b=2) 
>>> dl'a'l 
1 
>>> da 
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mydict.py 中 的 代码 如 下 : 


class Dict(dict): 


def init (self **kw): 
super(Dict self). init (**kw) 


def getattr (selt, key): 
try: 
return self[key] 
except KeyEi1ror: 
Talse AttributeError(r"DIict object has no attribute "%os" % key) 


def setattr (self, key, value): 
self[key| = value 


为 了 编写 单元 测试 ， 我 们 需要 引入 Python 自 带 的 unittest 模块 ， 编 写 mydict_test.py: 
import unittest 

from mydict import Dict 

class TestDict(unittest.TestCase): 


det test mit(self): 
d= Dict(a=]1. b='test’) 
selt.assertEquals(d.a, 1) 
selt.assertEquals(d.b. ‘test') 
self.assertTrue(1smstance(d., dict)) 


det test key(self): 
d= Dict() 
d[key’| = "value' 
self.assertEquals(d.key, value’) 


def test attr(self): 
d= DictO 
d.key = "value' 
selt.assertTrue( key’ Im d) 
self.assertEquals(d[ key’|, value’) 


det test keyerror(self): 
d= DictO) 
with self.assertRalses(KeyError): 
value = dfempty] 
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def test attrerror(self): 


d= DictO 
with self.assertRaises(AttrnbuteError): 
value = d.empty 


编写 单元 测试 时 ， 我 们 需要 编写 一 个 测试 类 ， 该 类 从 unittest.TestCase 继承 。 

以 test 开头 的 方法 就 是 测试 方法 ， 不 以 test 开头 的 方法 不 被 认为 是 测试 方法 ， 测 试 的 时 候 
不 会 被 执行 。 

对 每 个 类 进行 测试 都 需要 编写 一 个 test X X X0 方 法 。 由 于 unittestTestCase 类 提供 了 很 多 
内 置 的 条 件 判断 ， 我 们 只 需要 调用 这 些 方法 就 可 以 断言 输出 是 否 是 我 们 所 期 望 的 。 最 常用 的 断 
言 销 数 就 是 assertEquals0): 

self.assertEquals(abs(-1). 1) # 断言 函数 返回 的 结果 与 1 相等 


男 一 种 重要 的 断言 就 是 期 每 抛 出 指定 类 型 的 错误 ， 比 如 通过 d['empty'] 访 问 不 存在 的 键 时 ， 
1 言 会 抛 出 KeyError: 


with self.assertRaises(KeyE1rror): 
value = d|'empty | 


而 通过 dempty 访问 不 存在 的 键 时 ， 我 们 期 待 抛 出 AttibuteError: 
with self.assertRaises(AttrbuteError): 
value = d.empty 
9.4.2 ”运行 单元 测试 


一 旦 编写 好 单元 测试 , 就 可 以 运行 单元 测试 。 最 简单 的 运行 方式 是 在 mydict_testpy 的 最 后 
加 上 两 行 代码 : 


i name 一 ”Inam “: 
UnlttestInalnl ) 


这 样 就 可 以 把 mydict testpy 当 作 正常 的 Python 脚本 来 运行 : 
$python mydict test.py 
男 一 种 更 常见 的 方法 是 在 命令 行 中 通过 参数 -m unittest 直接 运行 单元 测试 : 


$ python -m unittest mydict test 


Ran $ tests In 0.000s 


OF 


这 是 推荐 做 法 ， 因 为 这 样 可 以 一 次 性 批量 运行 很 多 单元 测试 ， 并 且 有 很 多 工具 可 以 自动 运 
行 这 些 单元 测试 。 
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9.4.3 ”setUp() 与 tearDown() 方 法 


可 以 在 单元 测试 中 编写 两 个 特殊 的 setUpO 和 tearDown0 方 法 ， 这 两 个 方法 会 分 别 在 每 调用 
一 个 测试 方法 的 前 后 执行 。 

setUpO0 和 tearDown0 方 法 有 什么 作用 呢 ? 设 想 你 的 测试 需要 启动 一 个 数据 库 ， 这 时 ， 就 可 
以 在 setUp0 方 法 中 连接 数据 库 ， 在 tearDown0 方 法 中 关闭 数据 库 。 这 样 ， 就 不 必 在 每 个 测试 方 
法 中 重复 相同 的 代码: 


class TestDict(unittest.TestCase): 


det setUp(self): 
print 'setUp...' 


def tearDown(self): 
prnt ‘tearDown.... 


可 以 再 次 进行 测试 ,看 看 每 个 测试 方法 在 调用 前 后 是 否 会 打印 出 “setUp.. .” 和 “tearDown...”。 
单元 测试 可 以 有 效 地 测试 某 个 程序 模块 的 行为 ， 是 未 来 重 构 代码 的 信心 保证 。 单 元 测试 的 
测试 用 例 要 覆盖 常用 的 输入 组 合 、 边 界 条 件 和 异常 。 单 元 测试 的 代码 要 非常 简单 ， 如 果 测 试 代 


码 太 复杂 , 那么 测试 代码 本 号 就 可 能 有 bug。 而 且 , 单元 测试 通过 了 并 不 意味 大 程序 就 没有 bug， 
但 是 不 通过 的 话 程 序 肯 定 有 bug。 
文档 测试 

如 果 经 常 阅 读 Python 的 官方 文档 ， 那 么 可 以 看 到 很 多 文档 都 有 示例 代码 。 比 如 ，re 模块 束 
市 有 很 多 示例 代码 : 

>>> InDortTe 

>>> m= Te.search((?<=—abc)def. 'abcdef ) 

>>> mgroup(0) 

'def 


可 以 在 Python 的 交互 式 环境 下 输入 并 执行 这 些 示例 代码 , 结果 与 官方 文档 中 的 示例 代码 显 
示 的 一 致 。 

这 些 代 码 与 其 他 说 明 可 以 写 在 注释 中 ， 然 后 ， 由 一 些 工具 来 日 动 生成 文档 。 既 然 这 些 代 码 
本 刁 和 就 可 以 粘贴 出 来 直接 运行 ,那么 可 不 可 以 目 动 执 行 写 在 注释 中 的 这 些 代 码 呢 ? 答案 是 可 以 。 

当 我 们 编写 注释 时 ， 如 果 写 上 这 样 的 注释 : 

def abs(n): 


Function to get absolute value of number. 


Example: 
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>>> abs(]) 
] 

>>> abs(-1) 
] 

>>> abs(0) 
0 


Mt 


retum nif n>= 0 else (-n) 


无 疑 将 更 明确 地 告诉 调用 者 函数 的 期 望 输 入 和 输出 。 

此 外 ，Python 内 置 的 “文档 测试 ”(doctest) 模 块 可 以 直接 提取 注释 中 的 代码 并 执行 测试 。 

doctest 模块 严格 按照 Python 交互 式 命令 行 中 的 输入 和 输出 来 判断 测试 结果 是 否 止 确 。 只 有 
测试 异常 的 时 候 ， 可 以 用 ... 表 示 中 间 的 一 大 段 输出 。 

下 耐用 doctest 模块 测试 上 次 编写 的 Dict 类 : 


class Dict(dict): 


Mt 


Simple dict but also support access as xX.y style. 


>>> dl] = Dict() 

>>> dl[Xx|= 100 

>>> dl .x 

100 

>>> dl.y=200 

>>> dl[Y'| 

200 

>>> = Dict(a=], b=2, c=3") 
PC 

3 

>>> d2[empty] 

Traceback (most recent call last): 


keyFIror: empty 


>>> d2.empty 
Traceback (most recent call Jast): 


AttibuteError: DIct object has no attribute 'empty 


def init (self **kw): 
super(DIict, self}). mt (**kw) 


def getattr (selt, key): 
try: 
Tetum selflkey] 
except KeyE1ror: 
Talse AttributeError(r"DIict’ object has no attmbute '%os™ % key) 


2 


def setattr (self, key, value): 


self[key| = value 
i name — mam ~ 
Import doctest 
doctest.testmod() 
运行 python mydict.py: 
$ python mydict.py 


什么 输出 也 没有 。 这 说 明 我 们 编写 的 代码 都 是 正确 的 。 如 果 程 序 有 问题 , 比如 把 getattr 0 
方法 注释 掉 ， 再 次 运行 就 会 报错 : 


$ python mydict.py 


站 不 本 亲本 站 站 下 本 站 本 站 业 本 六 站 本 下 下 下 站 冰 本 末 本 末 环 站 下 下 本 站 末 本 玉环 站 站 环 下 下 本 本 冰冰 下 下 本 本 站 本 不 冰 本 下 站 末 本 冰 本 本 环 站 下 下 本 下 下 站 本 
File "mydictpy", Ine 7.mn mam .Dict 
Falled example: 
dl.x 
Exception raised: 
Traceback (most recent call last): 


AttributeError: DIct object has no attribute x' 


站 下 站 冰 下 站 生 下 下 半 求 站 六 下 站 下 末 下 下 下 站 末 下 来 六 末 太守 下 站 下 下 末末 玉环 六 站 末 下 下 下 站 下 下 下 下 玉 下 站 下 六 下 下 下 中 末 下 玉 下 来 下 下 下 不 下 下 玉 下 下 
File "mydictpy", lne13.In mam .Dict 
Falled example: 
d2.c 
Exception raised: 
Traceback (most recent call last): 


AttmbuteError 'Dict object has no attnbute 'c' 
注意 最 后 两 行 代码 。 当 模块 正常 导入 时 ，doctest 不 会 被 执行 。 只 有 在 命令 行 中 运行 时 ， 才 
执行 doctest。 所 以 ， 不 必 担 心 doctest 会 在 非 测 试 环境 下 执行 。 
由 此 可 见 ，doctest 非常 有 用 ， 不 但 可 以 用 来 测试 ， 还 可 以 直接 作为 示例 代码 。 通 过 条 些 文 
档 生 成 工具 ， 束 可 以 自动 把 包含 doctest 的 注释 提取 出 来 。 用 户 看 文档 的 时 候 ， 同 时 也 就 看 到 了 


doctest。 


E29 本 章光 结 


处 理 异 常 和 错误 是 程序 调试 必 不 可 少 的 。 任 何 一 门 编程 语言 都 需要 提供 异常 和 错误 处 理 机 
制 ， 以 便 节 省 程序 调试 时 间 ， 使 程序 更 健壮 。Python 语言 也 不 例外 ， 它 加 开发 人 员 提 供 了 完善 
的 异常 和 错误 处 理 机 制 。 本 章 首 先 介 绍 了 错误 和 异常 的 概念 , Python 的 内 置 异常 类 的 层次 结构 ， 
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requests 模块 相关 异常 ， 以 及 如 何 自 定 义 异 常 。 接 着 介绍 了 异常 处 理 ， 如 何 捕获 异常 (捕获 指定 
异常 、 多 个 异常 或 所 有 异常 )， 如 何 抛 出 异常 ， 如 何 跳 过 异常 ， 以 及 如 何 查 看 异常 。 接 着 介绍 了 
一 些 实用 的 程序 调试 方法 。 最 后 介绍 的 是 如 何 编写 和 使 用 单元 测试 和 文档 测试 。 


思考 与 练习 


1. 编写 一 个 除法 程序 ， 使 之 能 够 捕获 到 除 零 错误 。 

2. 定义 函数 func(filename)， 其 中 参数 flename 为 文件 的 路 径 。func0 函 数 的 功能 是 ， 打 开 
文件 ， 并 且 返 回 文件 的 内 容 ， 最 后 关闭 文件 ， 用 异常 处 理 可 能 发 生 的 错误 。 

3. 定义 函数 func(listinfo)， 其 中 参数 listinfo 为 列表 对 象 ， 例 如 : 


listmfo=[133.88.,33,22.44,11.,44,55,33,22.11,11.444.66,555| 


可 


该 函数 返回 一 个 包含 小 于 100 的 偶数 列表 ， 并 且 用 assert 语句 来 断言 返回 结果 和 类 型 。 

4. 目 定 义 一 个 异常 类 ， 它 继承 于 Exception 类 ， 捕 获 下 面 的 过 程 : 判断 为 raw_input0 输 入 
的 字符 串 长 度 是 否 小 于 5， 如 果 小 于 5， 比 如 输入 长 度 为 3， 就 输出 " The input is of length 
3,expecting at least $'， 大 于 5 的 话 输 出 "print success'。 

5. 编写 一 个 方法 用 于 减法 运算 ， 当 第 一 个 数 小 于 第 二 个 数 时 ， 抛 出 指明 “被 减 数 不 能 小 于 
减 数 ” 的 异常 。 
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第 10 章 
目录 和 文件 操作 


我 们 目前 的 操作 都 是 很 直观 地 执行 程序 ， 要 么 在 交互 模式 下 执行 ， 要么 执行 .py 文件 ,还 没 
有 涉及 文件 操作 。 

运行 程序 时 ， 用 变量 保存 数据 是 一 种 比较 通用 的 方法 。 如 果 和 希望 程序 运行 结束 后 数据 仍然 
能 够 保存 ， 就 不 能 使 用 变量 保存 数据 了 ， 需 要 寻找 其 他 方式 来 保存 数据 ， 文 件 就 是 不 错 的 选择 。 
在 程序 运行 过 程 中 将 数据 保存 到 文件 中 , 程序 运行 结束 后 ， 相 关 数 据 就 保存 到 文件 中 了 。 当 然 ， 
这 涉及 文件 操作 。 本 章 就 来 详细 介绍 常用 的 目录 和 文件 操作 。 


本 章 的 学 习 目 标 : 

e 通过 Python 在 硬盘 上 创建 文件 ; 

e 通过 Python 在 硬盘 上 访 取 文件 ; 

e 通过 Python 将 需要 保存 的 内 容 保存 到 硬盘 上 。 


操作 文件 和 目录 的 函数 一 部 分 放 在 os 模块 中 ， 男 一 部 分 放 在 ospath 模块 中 。 本 节 主 要 介 
绍 文件 操作 。 
10.1.1 打开 和 关闭 文件 
在 Python 中 ， 打 开 文 件 使 用 的 是 open0 函 数 。open0 函 数 用 于 打开 文件 ， 并 返回 文件 对 象 ， 
在 对 文件 进行 处 理 的 过 程 需 要 使 用 这 个 函数 。 如 果 文 件 无 法 打开 ， 会 抛 出 OSError 异常 。 
open0 函 数 的 党 用 形式 是 接收 两 个 参数 ， 文件 名 (人 file) 和 模式 (mode)。 语 法 格式 如 下 : 
open(file, mode=7') 
在 使 用 open0 函 数 的 时 候 ， 除 了 file 参数 必 填 外 ， 其 他 参数 可 以 选用 。 此 处 为 其 他 参数 使 
用 了 默认 值 。 需 要 注意 的 是 ， 使 用 open0 函 数 时 一 定 要 保证 关闭 文件 对 象 ， 即 调用 close0 函 数 。 
open0 函 数 的 完整 语法 格式 为 : 


open(file, mode=T. bufterme= - 1, encodme—None, errors=None, newlme=None., closetd=Tme, opener—=None) 


其 中 ， 各 项 参数 说 明 如 下 。 

e file: 必需 参数 ， 市 路 径 (相对 或 绝对 路 径 ) 的 文件 名 称 。 

e mode: 可 选 参数 ， 文 件 打 开 模 式 。 

e buffering: 用 于 设置 缓冲 策略 。 在 二 进 制 模式 下 ， 使 用 0 来 切换 缓冲 ; 在 文本 模式 下 ， 
通过 1 表示 行 缓冲 (固定 大 小 的 缓冲 区 )。 在 不 指定 参数 值 的 情况 下 ， 二 进 制 文件 的 缓冲 
区 大 小 由 底层 设备 决定 ， 可 以 通过 io.DEFAULT BUFFER SIZE 获取， 通常 为 4096 或 
8192 字 节 。 文 本 文件 则 采用 行 缓冲 。 

e encoding: 编码 或 解码 方式 。 默 认 编 码 方式 依赖 平台 ， 如 果 需 要 特殊 设置 ， 可 以 参考 
codecs 模块 ， 获 取 编 码 列表 。 一 般 使 用 utf-8。 

e errors: 报错 级 别 。 可 选 参数 ， 并 且 不 能 用 于 二 进 制 模式 ， 它 指定 了 编码 错误 的 处 理 方 
式 ， 可 以 通过 codecs.Codec 获得 编 公 错误 字符 串 。 

e newline: 换行 控制 ， 可 取 值 有 None、\、A、'Nm'。 输 入 时 ， 如 果 参 数值 为 None， 那 
么 行 结束 的 标志 符 可 以 是 mw、 、'n 中 的 任意 一 个 ， 并 且 这 三 个 标志 符 都 会 首先 被 转 
换 为 nn'， 人 然后 才 会 被 调用 。 

@ closefd: 传 入 的 file 参数 类 型 。 为 False 时 ， 当 文件 关闭 时 底层 文件 描述 符 仍 然 为 打开 
状态 ， 这 是 不 被 允许 的 ， 所 以 ， 需 要 设置 为 True。 

e opener: 必须 返回 所 打开 文件 的 描述 。 可 以 将 os.open 作为 *opener* 的 结果 ， 在 功能 上 ， 
类 似 于 设置 opener 为 None。 

操作 文件 的 流程 如 下 : 

(1) 打开 文件 ， 得 到 文件 句柄 并 赋值 给 一 个 变量 。 

(2) 通过 句柄 对 文件 进行 操作 。 

(3) 关闭 文件 。 

简单 示例 如 下 : 


# 打 开 文 件 ， 得 到 文件 句柄 并 赋值 给 一 个 变量 
f=open(a.txt',T',encodine='utf-8") # 中 认 打开 模式 为 T 
# 通 过 句 栅 对 文件 进行 操作 

data=f.read() 

# 关闭 文 件 

f.close() 


下 面 是 一 个 使 用 open0 函 数 操 作文 件 的 完整 示例 程序 : 


fllename = input(" 输 入 文件 名 : ") 
fd= open(filename, WwW)  # 以 写 入 模式 打开 文件 
while 1: # 使 用 while 1 的 形式 ， 效 率 最 高 
conttext 二 input(" 输 入 文件 的 内 容 ( 输 入 EOF 结束 写 入 ):") 
if conttext 一 下 OF 
fd.closeg0) # 输 入 EOF 就 退出 写 入 ， 关 财 文 件 
break 
else: # 写 入 文件 内 容 
fd.wrnte(conttext) 
fa.write(m) ”# 写 入 换行 ， 不然 会 写 在 一 行 上 。 写 入 的 数据 必须 是 字符 申 
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fdread = open(filename) 的 ] 开 文件 让 认 契 读 忆 式 


print(" HH HT / i 
readconttxt = fdread.read() pe 读 到 的 文件 内 容 放 到 变量 中 打印 
Te 
print( nas 一 一 一 一 一 HH 机 村 和 sr ") 


10.1.2 ”文件 模式 


在 10.1.1 节 中 讲 到 ， 使 用 open0 函 数 时 可 以 选择 是 否 传 入 mode 参数 。 在 前 面 的 示例 中 ， 
mode 参数 的 值 为 w， 这 是 什么 意思 呢 ?mode 参数 可 以 传 入 哪些 值 ? 具体 如 表 10-1 所 示 。 
表 10-1 文件 模式 
文本 模式 (默认 ) 
写 模式 ， 新 建 一 个 文件 ， 如 果 该 文件 已 存在 ， 则 会 报错 
二 进 制 模式 
打开 一 个 文件 进行 更 新 (可 读 、 可 写 ) 
通用 换行 模式 (不 推荐 ) 
以 只 读 方 式 打 开 文件 。 文 件 的 指针 将 会 放 在 文件 的 开头 。 这 是 默认 模式 
以 二 进 制 格式 打开 一 个 文件 用 于 只 读 。 文 件 指针 将 会 放 在 文件 的 开头 。 这 是 默认 模式 。 一般 
用 于 非 文 本 文件 ， 如 图 片 等 
I+ 打开 一 个 文件 用 于 读 写 。 文 件 指 针 将 会 放 在 文件 的 开头 
Tb+ 以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 文件 指针 将 会 放 在 文件 的 开头 。 一 般 用 于 非 文本 文件 ， 
如 图 片 等 
W 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 ， 则 打开 该 文件 ， 并 从 开头 开始 编辑 ， 即 原 有 
内 容 会 被 删除 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 
wb 以 二 进 制 格式 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 ， 则 打开 该 文件 ， 并 从 开头 开始 
编辑 ， 即 原 有 内 容 会 被 删除 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 。 一 般 用 于 非 文 本 文件 ， 如 
图 片 等 
Wt+ 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 则 打开 该 文件 ， 并 从 开头 开始 编辑 ， 即 原 有 内 
容 会 被 删除 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 
WwWb+ 以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 则 打开 该 文件 ， 并 从 开头 开始 编 
辑 ， 即 原 有 内 容 会 被 删除 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 。 一 般 用 于 非 文本 文件 ， 如 图 
片 等 
a 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 也 就 是 说 ， 新 
的 内 容 将 会 被 写 入 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 进行 写 入 
ab 以 二 进 制 格式 打开 一 个 文件 用 于 退 加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 
也 就 是 说 ， 新 的 内 容 将 会 被 写 入 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 进行 写 入 
at 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 , 文件 指针 将 会 放 在 文件 的 结尾 。 文 件 在 打开 时 
会 处 于 退 加 模式 。 如 果 该 文件 不 存在 ， 则 创建 新 文件 用 于 读 写 
ab+ 以 二 进 制 格式 打开 一 个 文件 用 于 退 加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 的 结尾 。 
如 果 该 文件 不 存在 ， 则 创建 新 文件 用 于 读 写 
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使 用 open0 函 数 时 ， 明 确 指定 读 模 式 和 什么 模式 都 不 指定 的 效果 是 一 样 的 。 使 用 写 模式 可 
以 同文 件 写 入 内 容 。+ 参 数 可 以 用 到 其 他 任何 模式 中 ， 以 指明 读 写 都 是 允许 的 。 比 如 ，w+ 可 以 
在 打开 文件 时 用 于 文件 的 读 写 。 

当 参 数 带 有 字母 b 时 ， 表 示 可 以 用 来 读 取 二 进 制 文件 。Python 在 一 般 情况 下 处 理 的 都 是 文 
本 文件 ， 当 然 有 时 也 避免 不 了 处 理 其 他 格式 的 文件 。 

open0 函 数 默 认为 文本 模式 ， 如 果 要 以 二 进 制 模式 打开 ， 加 上 字母 b。 


10.1.3 ”缓冲 


缓冲 一 般 是 指 内 存 ， 计 算 机 从 内 存 中 读 取 数据 的 速度 远 远 大 于 从 磁盘 读 取 数据 的 速度 ， 一 
般 内 存 大 小 远 小 于 磁盘 大 小 ， 内 存 的 速度 比较 快 ， 但 资源 比较 紧张 ， 所 以 有 必要 对 数据 进行 组 
冲 设 置 。 

将 文件 内 容 写 入 硬件 设备 时 ， 使 用 系统 调用 ， 这 类 IO 操作 时 间 长 ， 为 了 减少 IO 操作 ， 
通 弟 会 使 用 缓冲 区 (有 足够 多 的 数据 时 才 调 用 )。 

比如 打开 浏览 器 ， 访 问 白 度 首 页 ， 浏 览 器 需要 通过 网 络 IO 获取 日 度 首 页 。 浏 览 右 首先 会 
发 送 数 据 给 百度 服务 器 ， 以 告 告知 想 要 访问 百度 首页 ， 这 个 动作 是 往外 发 数据 ， 叫 Output; 随 
后 百度 服务 器 把 百度 首页 发 过 来 ， 这 个 动作 是 从 外 面 接 收 数据 ， 叫 Input。 通 常 ， 程 序 完成 VO 
操作 时 会 有 Input 和 Output 两 个 数据 流 。 当 然 也 有 只 使 用 一 个 数据 流 的 情况 ， 比 如 从 磁盘 读 取 
文件 到 内 存 ， 只 有 Input 操作 :， 反 过 来 ， 把 数据 写 到 磁盘 文件 里 ， 只 有 Output 操作 。 

文件 缓冲 行为 分 为 全 缓冲 、 行 缓冲 和 无 绥 冲 。 当 使 用 文件 缓冲 时 ，open0 函 数 设 置 如 下 : 

open(',"', buffering=a)  # 使 用 buffering 设置 缓冲 行为 

open0 印 数 的 第 三 个 参数 用 于 设置 文件 缓冲 行为 。 对 于 每 种 文件 绥 冲 行为 的 设置 如 下 。 

e 全 绥 冲 : a 是 正 整 数 ， 当 缓冲 区 大 小 达到 a 指定 的 大 小 时 ， 写 入 磁盘 。 

e 行 缓冲: 设置 buffering=1， 绥 剖 区 碰 到 \n 换行 行 时 束 写 入 磁盘 。 

e 无 缓冲 : 设置 buffering =0， 写 多 少 ， 存 多 少 。 

示例 程序 如 下 : 


#1!/usr/bin/python3 


# 设置 定 长 缓冲 区 

wlth open( test.text', w+. encodine='"utf-8", buflerme—=20) as 鞋 
fwrite(hello word' 
fwrite( 定 个 小 目标 ， 挣 一 个 亿 ) 
ft.write(are you OK ) 


# 设置 行 缓冲 
with open(test 1.text, w+', encodme—'‘utt-8", buffterme—=1) ast: 
fwnte(hello wordl\n') 


fwrite( 定 个 小 目标 ， 择 一 个 fn) 
fwrite(are YOU OK ) 


# 设置 无 缓冲 
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# 注意 ， 对 于 text 文件 类 型 必须 写 缓 冲 区 
with open( test 2.text, wb+', bufferme—0) ast 
twrite(b'hello wordl\n') 
.write(b'are you OK ) 


基本 文件 方法 


10.1 节 介 绍 了 用 于 打开 文件 的 open0 函 数 ， 也 做 了 一 些 简 单 操作 。 在 使 用 open0 函 数 时 ， 
会 创建 文件 对 象 ，Python 针对 文件 对 象 封 装 了 一 些 常用 的 方法 ， 如 表 10-2 所 示 。 


表 10-2 文件 对 象 的 党 用 方法 


方法 摘 述 
file.closeO 关闭 文件 。 关 闭 后 文件 不 能 再 进行 读 写 操作 
file.flush() 刷新 文件 内 部 缓冲 区 ， 直 接 把 内 部 缓冲 区 的 数据 立刻 写 入 文件 , 而 不 是 被 动 等 
待 写 入 输出 缓 神 区 
file.fileno() 返回 一 个 整 型 的 文件 描述 符 ， 可 以 用 在 os 模块 的 read0 方 法 等 一 些 底 层 操作 上 
file.isatty() 如 果 文 件 连 接 到 终 靖 设备 ， 就 返回 Tme， 否 则 返回 False 
file nextO 返回 文件 中 的 下 一 行 
file.read([size]) 从 文件 读 取 指定 的 字 节 数 ， 如 果 未 给 定 或 为 负 ， 则 读 取 所 有 内 容 
filereadline([size]) 读 取 整 行 ， 包 括 \n 字符 
file.readlines([sizeint]) 读 取 所 有 行 并 返回 列表 , 大 给 定 sizeint>0, 返回 总 和 大 约 为 sizeint 字 节 的 行 , 实 


际 读 取 值 可 能 比 sizeint 大 ， 因 为 需要 填充 缓冲 区 
file.seek(offset[. whence]) 设置 文件 当前 位 置 


file tell0 返回 文件 当前 位 置 
file.truncate([size]) 从 文件 的 首 行 中 的 首 字 符 开 始 截 断 , 截断 文件 为 size 个 字符 , 不 指定 size 的 话 ， 


表示 从 当前 位 置 截 断 ; 截断 之 后 ， 后 面 的 所 有 字符 被 删除 ， 其 中 Windows 系 
统 下 的 换行 代表 两 个 字符 大 小 

file.write(str) 将 字符 串 写 入 文件 ， 返 回 的 是 写 入 的 字符 长 度 

file.writelines(sequence) 同文 件 写 入 一 个 序列 ， 如 果 和 需要 换行 ， 就 自己 加 入 每 行 的 换行 得 


在 对 文件 对 象 的 常用 方法 进行 学 习 之 前 ， 首 先 来 了 解 一 下 流 的 概念 ， 进 而 了 解 文 件 操作 的 
原理 。IO 编程 中 ，Stream( 流 ) 是 一 个 很 重要 的 概念 。 可 以 把 流 想 象 成 一 根 水 管 ， 数 据 就 是 水 流 
中 的 水 ， 但 是 只 能 单 回流 动 。 输 入 流 就 是 数据 从 外 面 (磁盘 、 网 络 ) 流 入 内 存 ， 输 出 流 就 是 数据 
从 内 存 流 到 外 面 去 。 浏 览 网 页 时 ， 浏览 器 和 服务 占 之 间 至 少 需 要 建立 “两 根 水 管 ”( 输 入 流 和 输 

出 流 )， 才 能 既 发 送 数据 又 接收 数据 。 


10.2.1 读 和 瑟 


文件 对 象 提 供 了 一 组 访问 方法 。 最 基本 的 文件 操作 就 是 文件 读 写 。 文 件 对 象 主 要 通过 使 用 
read0 和 write0 方 法 来 读 取 和 写 入 文件 。 
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1. read() 


read0 方 法 用 于 从 文件 读 取 指 定 的 字 节 数 ， 如 果 未 给 定 或 为 负 ， 则 读 取 所 有 内 容 。 语 法 格式 
如 下 : 


flleObject. read( [sizel): 


其 中 ， 参 数 size 指定 从 文件 中 读 取 的 字 节 数 。read0 方 法 返回 的 是 从 字符 串 中 读 取 的 字 节 。 
read([size]) 方 法 从 文件 当前 位 置 起 读 取 size 字 节 ， 如 果 不 指 定 参 数 size， 则 表示 读 取 人 到 文件 结束 
为 止 ， 范围 为 字符 串 对 象 ， 输 出 结果 是 字符 串 ， 在 使 用 时 需要 对 这 个 字符 串 进行 分 隔 处 理 后 才 
能 使 用 。 

下 面 通 过 示例 来 讲解 如 何 通 过 read0 方 法 读 取 文件 内 容 。 假 设 有 一 个 文件 test.txt, 内 容 如 下 : 

这 是 第 一 行 

这 是 第 二 行 

这 是 第 三 行 

这 是 第 四 行 

这 是 第 五 行 

下 面 通过 read0 方 法 读 取 该 文件 ， 示 例 程序 如 下 : 


#1/ust/bin/python3 


# 打开 文件 

fo = open( "test.txt", "r+") 

print ("文件 名 为 :", fo.name) 

lme = fo.read( 10) 

print (" 读 取 的 字符 串 : %s" % (line)) 
# 关闭 文件 

fo.close() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


文件 名 为 : test.txt 
读 取 的 字符 串 : 这 是 第 一 行 
这 是 第 二 


2.readlinel() 


readline0 方 法 用 于 从 文件 读 取 整 行 ， 包 括 \n 字符 。 如 果 指 定 size 参数 为 一 个 非 负 数 ， 则 返 
回 指定 大 小 的 字 节 数 ， 包 括 \n 字符 。 语 法 格式 如 下 : 

flleObject.readlme(size): 

其 中 ，size 参数 指定 从 文件 中 读 取 的 字 节 数 。readline0 方 法 返回 的 是 从 字符 串 中 读 取 的 字 
节 。 从 字面 意思 可 以 看 出 ，readline0 方 法 每 次 读 出 一 行内 容 ， 所 以 ， 读 取 时 占用 内 存 小 ， 比 较 
适合 大 文件 。readline0 方 法 返回 一 个 字符 串 对 象 。 


220 


第 10 章 目录 和 文件 操作 


下 面 通过 示例 来 说 明 readline0 方 法 的 使 用 。 假 设 有 如 下 网 址 列表 文件 urls.txt: 


http://www.baidu.cony 
http://Wwww.baidu.com/ 
http://Wwww.baidu.com/ 
http://www.baidu.cony 
http://www.baidu.cony 


下 面 通过 readline0 方 法 循环 读 取 这 个 文件 的 内 容 ， 示 例 程序 如 下 : 
#lusr/bm/python 


# -*- codine: UTF-8 -*- 


# 打开 文件 

fo = open("urls.txt", "r+") 

print ("文件 名 为 :", fo.name) 

lme = fo.readlme() 

print (" 读 取 第 一 行 %6s" % (line)) 

lme = fo.readlme($) 

print (" 读 取 的 字符 串 为 : %s" % (line)) 


# 关闭 文件 

fo.close() 

执行 以 上 程序 ， 输 出 结果 如 下 : 
文件 名 为 : urls.txt 

读 取 第 一 行 http://www.baidu.comy 


读 取 的 字符 串 为 : http: 


3.readlines() 

readlines0 方 法 用 于 读 取 所 有 行 ( 直 到 文件 结束 符 EOF) 并 返回 一 个 列表 ， 该 列表 可 以 由 
Python 的 for... im . 结构 进行 处 理 。 如 果 碰 到 文件 结束 符 EOF， 则 返回 空 字符 串 。 语 法 格式 
如 下 : 

flleObject.readlmes( ): 

readline0 方 法 返回 一 个 列表 ， 里 面包 含 所 有 的 行 。 例 如 ， 使 用 readlines0 方 法 读 取 前 面 的 
urls.txt 文件 ， 示 例 程序 如 下 : 

#1l/usr/bm/python3 

# 打开 文件 


fo = open("urls.txt", "r") 
print ("文件 名 为 :", fo.name) 
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for line in fo.readlines(): # 依 次 读 取 每 行 
line = line.stripO # 去 挥 每 行头 尾 空白 
print(" 读 取 的 数据 为 : %s" % (line)) 

# 关闭 文件 

fo.close() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


文件 名 为 : urls.txt 

读 取 的 数据 为 : http://www.baidu.cony 
读 取 的 数据 为 : http://www.baidu.conmy 
读 取 的 数据 为 : http://www.baidu.conmy 
读 取 的 数据 为 : http;//www.baidu.comy 
读 取 的 数据 为 : http://www.baidu.cony 


由 此 可 见 ，read0、readlineO0 和 readlines0 方 法 之 间 的 区 别 如 下 : 
e TIead0 方 法 逐个 读 取 字符 ， 处 理 比 较 烦 琐 。 
e TIeadline0 方 法 每 次 读 出 一 行内 容 ， 所 以 ， 读 取 时 占用 内 存 小 ， 比 较 适 合 大 文件 ， 它 返回 


一 个 字符 串 对 象 

e TIeadlines(0 方 法 读 取 整 个 文件 的 所 有 行 ， 保 存在 一 个 列表 中 ， 每 行 作 为 一 个 元 素 ， 但 读 
取 大 文件 会 比较 占 内 存 。 

4. Write() 


write0 方 法 用 于 回 文 件 中 写 入 指定 的 字符 串 。 在 文件 关闭 前 或 缓冲 区 刷新 前 ， 字 符 串 内 容 
存储 在 缓冲 区 中 ， 这 时 在 文件 中 看 不 到 写 入 的 内 容 。 
如 果 文 件 打开 模式 高 有 字母 b， 那 么 写 入 文件 内 容 时 ，str 参数 要 用 编码 方法 转换 为 字 节 形 
否则 报错 : TypeError: a bytes-like object is required, not 'str 。 
write0 方 法 的 语法 格式 如 下 : 


flleObject.wnte(| str ]) 


str 参数 为 要 写 入 文件 的 字符 串 。write0 方 法 返回 的 是 写 入 的 字符 长 度 。 以 wrls.txt 文件 为 例 
写 入 内 容 ， 示 例 程序 如 下 : 


#!/usr/bin/python3 


A 


“BE 


# 打开 文件 
fo = open("urls.txt", "r+") 
print ("文件 名 :", fo.name) 


str= "6:WWW.csdn.com" 
# 在 文件 末尾 写 入 一 行 
fo.seek(0. 2) 

lne = fo.wrnite( str ) 
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# 读 取 文件 所 有 内 容 
fo.seek(0.0) 
for mdex In ranee(6): 
lme = next(fo) 
print ("文件 行 号 %6d - %s" % (index, line)) 


# 关闭 文件 
fo.close() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


文件 名 : tls.txt 
文件 行 号 0 - http://www.baidu.comy/ 


文件 行 号 1 - http://www.baidu.comy 
文件 行 号 2 - http://www.baidu.cony 
文件 行 号 3 - http://www.baidu.com/ 
文件 行 号 4- http://www.baidu.cony 


文件 行 号 5- 6:www.csdn.com 


D. close() 


close0) 方 法 用 于 关闭 已 打开 的 文件 。 关 闭 后 的 文件 不 能 再 进行 该 写 操作 ， 否 则 会 触发 
ValueError 错误 。close0 方 法 允许 调用 多 次 。 

当 文 件 对 象 被 引用 到 操作 男 一 个 文件 时 ，Python 会 目 动 关闭 之 前 的 文件 对 象 。 使 用 closeO) 
方法 关闭 文件 是 一 个 好 的 习惯 。 

close0 方 法 的 语法 格式 如 下 : 

flleObject.close(): 

close0) 方 法 没有 参数 ， 也 没有 返回 值 。 执 行 后 会 直接 关闭 调用 的 文件 对 象 。 

以 下 示例 演示 close0 方 法 的 使 用 : 

#1/usr/binpython3 

# 打开 文件 


fo = open("urls.txt", "wb") 
print(" 关 闭 的 文件 名 为 :", foname) 


# 关闭 文件 
fo.close() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


3233 


关闭 的 文件 名 为 : Urlstxt 


10.2.2 ” 重 命 名 


Python 的 os 模块 提供 了 文件 和 目录 的 重 命 名 方法 os.rename0O， 用 于 命名 文件 或 目录 。 在 对 
文件 或 目录 进行 重 命名 时 , 如 果 指 定 的 新 文件 名 或 目录 名 在 相同 路 径 下 已 存在 , 将 抛 出 OSError 
错误 。os.rename0 方 法 的 语法 格式 如 下 : 


0s.rename(src, dst) 
osTename0 方 法 没有 返回 值 。 以 下 示例 演示 了 osrename0 方 法 的 使 用 : 


#1/usr/bimypython3 
Import Os, sys 


# 列 出 目录 
print ("目录 为 : %s"%os.listdir(os.getewdO)) 


# 重 命名 
os.rename( "test"."test2") 


print (" 重 命名 成 功 ") 


# 列 出 重 命名 后 的 目录 
print ("目录 为 : %s" %os.listdir(0s.getewdO0)) 


执行 以 上 程序 ， 输 出 结果 如 下 : 
目录 为 : 
| 'al.txt',resume.doc','a3.py’,'test | 


重 命名 成 功 
[ 'al.txt'resume.doc',a3.py','test2" | 


10.2.3 ”序列 化 和 反 友 列 化 


每 种 编程 语言 都 有 各 目的 数据 类 型 ， 其 中 面 问 对 象 编程 语言 还 允许 开发 者 自 定 义 数 据 类 型 
(如 自 定 义 类 )，Python 也 一 样 。 很 多 时 候 我 们 会 有 下 面 这 样 的 需求 : 

e 把 内 存 中 的 各 种 数据 类 型 的 数据 通过 网 络 传送 给 其 他 机 器 或 客户 端 。 

e 把 内 存 中 的 各 种 数据 类 型 的 数据 保存 到 本 地 磁盘 以 持久 化 。 

如 果 要 将 一 个 系统 中 的 数据 通过 网 络 传输 给 其 他 系统 或 客户 端 ， 通 常 需要 先 把 这 些 数 据 转 
换 为 字符 串 或 字 节 串 ， 而 且 需 要 规定 一 种 统一 的 数据 格式 才能 让 数据 接收 新 正确 解析 并 理解 这 
些 数据 的 含义 。XML 是 早期 被 广泛 使 用 的 数据 交换 格式 ， 在 早期 的 系统 集成 论文 中 经 常 可 以 
看 到 XML 的 身影 如今 大 家 使 用 更 多 的 数据 交换 格式 是 JSONGUavaScript Object Notation)， 它 
是 一 种 轻 量 级 的 数据 交换 格式 。JSON 相对 于 XML 而 言 ， 更 加 简单 、 易 于 阅读 和 编写 ， 同 时 也 
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易于 机 器 解析 和 生成 。 除 此 之 外 ， 我 们 也 可 以 自 定义 内 部 使 用 的 数据 交换 格式 。 

如 果 想 把 数据 持久 化 到 本 地 磁盘 ， 这 部 分 数据 通常 只 供 系统 内 部 使 用 ， 因 此 数据 转换 协议 
以 及 转换 后 的 数据 格式 也 就 不 再 要 求 是 标准 、 统 一 的 ， 只 要 系统 内 部 能 够 正确 识别 即 可 。 但 是 ， 
0 提高 效率 )， 因 此 

通 芝 会 涉及 转换 协议 与 编程 语言 的 版 本 兼容 问题 

将 对 象 转换 为 可 通过 网 络 传输 或 可 以 存储 到 本 地 磁盘 的 数据 格式 (如 XML JSON 或 特定 格 
式 的 字 节 串 ) 的 过 程 称 为 序列 化 ， 反之， 则 称 为 反 序 列 化 。 

Python 语言 内 置 了 用 于 进行 数据 序列 化 的 模块 ， 如 表 10-3 所 示 。 


表 10-3 ”序列 化 模块 


模块 名 称 |  。 撕 x 接口 


json 用 于 实现 Python 数据 类 型 与 通用 0SON) 字 符 串 之 间 的 | dumps0、dump0、loads0、load0 


pickle 用 于 实现 Python 数据 类 型 与 Python 特定 二 进 制 格 式 之 | dumps0、dumpO、loads0、load0 


shelve 专门 用 于 将 Python 数据 类 型 的 数据 持久 化 到 磁盘 ， openO 


shelve 类 似 于 字典 ， 操 作 十 分 便捷 


1. json 模块 的 序列 化 和 反 序列 化 


大 部 分 编程 语言 都 会 提供 处 理 JSON 数据 的 接口 ，Python 2.6 开始 加 入 json 模块 ， 并 且 把 
它 作 为 内 置 模块 提供 ， 无 须 下 载 即 可 使 用 。 

json 模块 的 序列 化 与 反 序 列 化 的 过 程 分 别 叫 作 encoding 和 decoding。 

e encoding: 把 Python 对象 转换 成 JSON 字符 串 。 

e decoding: 把 JSON 字符 串 转 换 成 Python 对 象 。 

json 模块 提供 了 以 下 两 个 方法 来 进行 序列 化 和 反 序 列 化 操作 : 


# 序列 化 :将 Python 对 象 转换 成 JSON 字符 串 

dumps(obl. skipkeys=False, ensure asci=Trme. check circular=Tme. alow nan=True, cls=None. ndent—=None., 
separators=None, default=None, sort keys=False, **kw) 

# 反 序列 化 : 将 JSON 字符 串 转换 成 Python 对 象 

loads(s. encodine—=None. cls=None. object hook=None. parse float=None., parse nt=None. parse constant=None., 
object palrs hook—=None, **kKWw) 


除 此 之 外 , json 模块 还 提供 了 两 个 额外 的 方法 , 它们 允许 我 们 直接 将 序列 化 后 得 到 的 JSON 
数据 保存 到 文件 中 ， 以 及 直接 读 取 文件 中 的 JSON 数据 进行 反 序 列 化 操作 : 


# 序 列 化 : 将 Python 对 象 转换 成 JSON 字符 串 并 存储 到 文件 中 

dump(ob], fp, sapkeys=False. ensure ascu=True, check circular=Tme, alow nan=Trme, cls=None, mdent=None, 
separators=None. default=None. sort keys=False, **kw) 

# 反 序列 化 ， 读 取 指定 文 件 中 的 JSON 字符 串 并 转换 成 Python 对 象 

load(fp. cls=None. oblect hook—=None, parse float=None., parse mt=None, parse constant=None., 
object pairs hook=None, **kw) 


225 量 


在 序列 化 和 反 序 列 化 操作 过 程 中 , JSON 与 Python 之 间 数 据 类 型 的 对 应 关系 如 表 10-4 和 表 


10-5 所 示 。 


表 104 Python 转 JSON 


Python JSON 
字典 对 象 
列表 、 元 组 数组 
字符 串 字符 串 
int、float、 派 生 于 int 和 float 类 型 的 枚 举 数字 
True True 
False False 
None Null 

表 10-5 JSON 转 Python 

JSON Python 
对 象 字典 
数组 列表 
字符 串 字符 串 
数字 ( 整 型 ) int 
数字 (实数 ) float 
True True 
False False 
Null None 


需要 注 蕊 的 磊 : 


e Python 字典 中 的 键 ( 非 字 符 串 ) 在 转换 成 JSON 字符 串 时 都 会 被 转换 为 小 写字 符 串 。 

e Python 中 的 元 组 在 序列 化 时 会 被 转换 为 数组 ， 但 在 反 序 列 化 时 ， 数 组 会 被 转换 为 列表 。 

由 以 上 两 点 可 知 ， 当 Python 对 象 中 包含 元 组 数据 或 字典 ， 且 字典 中 存在 非 字 符 串 形式 的 键 
时 ， 肥 序列 化 后 得 到 的 结果 与 原来 的 Python 对 象 是 不 一 致 的 。 

对 于 Python 内 置 的 数据 类 型 (如 字符 串 、Unicode、int、float、bool、None、 列 表 、 元 组 、 
字典 ), json 模块 可 以 直接 进行 序列 化 / 反 序列 化 处 理 ; 对 于 目 定 义 类 的 对 象 进行 序列 化 和 反 序 列 
化 时 ， 需 要 我 们 日 定 义 方法 来 完成 对 象 和 字典 之 间 的 转换 。 

下 面 是 使 用 json 模块 序列 化 stu 对 象 的 示例 : 


>>> Import json 
>>> obj2dict(stu) 


{sno:1,' module ':' mam ,ape': 19,' class "Student ‘name': TIom } 


>>> json.dumps(obj2dict(stu)) 


sno": 1.” module ":" mam ","age":19,"” class ": "Stdent", "name": "TIom 


>>> json.dumps(stu, default=obj2dict) 


Sno" 1.” module ":" mam ","ape":19,”" Class ": "Student "name": "IOm 上 
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下 面 是 一 个 肥 序 列 化 示例 : 


>>> Json.loads('{"sno": 1.” module ":™" mam ","age":19," class ": "Student", "name": "Tom"}") 

{usno: 1.U module ‘uw mam ‘uaee': 19,uname:uTom,u class ‘usStudent'} 

>>> dict2obj(Json.loads('{"sno": 1," module ":" mam ","ape":19," class ":"Student", "name": 
"Tom"}’) 

Student [name: Tom, age: 19. sno: 1| 

>>> Json.loads({"sno": 1.” module ":" mam ","apge":19," class ":"Student", "name": "Tom"}, 
oblect hook—dict20b]) 

Student [name: Tom, age: 19. sno: ] | 


2. pickle 模块 的 序列 化 和 反 序列 化 


pickle 模块 实现 了 用 于 对 Python 对 象 进行 序列 化 和 反 序列 化 的 二 进 制 协 议 ， 与 json 模块 不 
同 的 是 ，pickle 模块 的 序列 化 和 反 序 列 化 过 程 分 别 叫 作 pickling 和 unpickling。 
e Dickling 是 将 Python 对 象 转换 为 字 节 流 的 过 程 。 
e Unpickling 是 将 字 节 流 或 字 节 对 象 转换 回 Python 对 象 的 过 程 。 
1) pickle 模块 与 json 模块 对 比 
e JSON 是 一 种 文本 序列 化 格式 (输出 的 是 Unicode 文件 ， 大 多 数 时 候 会 被 编码 为 utf-8)， 
而 pickle 是 一 种 二 进 制 序列 化 格式 。 
e JOSN 是 人 们 可 以 读 懂 的 数据 格式 ， 而 pickle 是 二 进 制 格式 ， 人 们 无 法 读 懂 。 
e JSON 是 与 特定 的 编程 语言 或 系统 无 关 , 且 在 Python 生态 系统 之 外 被 广泛 使 用 , 而 pickle 
使 用 的 数据 格式 特定 于 Python。 
e 默认 情况 下 ，JSON 只 能 表示 Python 的 内 建 数据 类 型 ， 对 于 日 定义 数据 类 型 需要 做 一 
些 额外 的 工作 ，Ppickle 可 以 直接 表示 大 量 的 Python 数据 类 型 ， 包 括 自 定义 数据 类 型 。 
(2) pickle 模块 使 用 的 数据 流 格 式 
上 面 提 到 ,pickle 使 用 的 数据 格式 特定 于 Python。 这 使 得 pickle 不 受 限 于 诸如 JSON 或 XDR 
的 外 部 标准 ， 但 是 这 也 意味 着 非 Python 程序 可 能 无 法 重建 pickled Python 对 象 。 默 认 情 况 下 ， 
pickle 数据 格式 使 用 相对 紧凑 的 二 进 制 表示 形式 。 如 果 需 要 最 佳 大 小 特征 ， 可 以 有 效 地 压缩 
pickled 数据 。pickletools 模块 包含 可 以 用 于 对 pickle 生成 的 数据 流 进行 分 析 的 工具 。 目 前 有 5$ 
种 不 同 的 协议 可 以 用 于 pickle。 使 用 的 协议 越 高 ， 就 需要 越 新 的 Python 版 本 以 读 取 pickle 产生 
的 数据 : 
e 协议 v0 是 原始 的 “人 类 可 读 ” 协 议 ， 并 且 向 后 兼容 早期 的 Python 版 本 。 
e 协议 vl 是 一 种 旧 的 二 进 制 格 式 ， 也 与 早期 版 本 的 Python 兼容 。 
e 协议 V2 在 Python2.3 中 引入 ， 能 提供 更 高 效 的 pickling 操作 。 
e 协议 v3 在 Python 3.0 引入 ， 明 确 支 持 字 节 对 象 ， 且 不 能 被 Python 2.x 进行 unpickling 
操作 : 这 是 默认 协议 ， 也 是 当 需 要 兼容 其 他 Python 3X 版 本 时 推荐 使 用 的 协议 。 
e 协议 v4 在 Python 3.4 中 引入 ， 添 加 了 对 极 大 对 象 的 支持 ， 能 对 更 多 种 类 的 对 象 执行 
pickling 操作 ， 并 且 文 持 对 一 些 数据 格式 进行 优化 。 
(3) pickle 模块 提供 的 相关 函数 
pickle 模块 提供 的 几 个 序列 化 / 反 序列 化 函数 与 json 模块 基本 一 致 ， 这 些 国 数 如 下 : 
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# 将 指定 的 Python 对 象 通过 Pickle 序列 化 后 作为 字 节 对 象 返回 ， 而 不 是 写 入 文件 

dumps(ob], protocol—=None, *, fix 1mports=True) 

# 对 通过 pickle 序列 化 后 得 到 的 学 节 对 象 进行 反 序列 化 ， 转 换 为 Python 对 象 并 返回 

loads(bytes oblect *, fix mports=Trme, encodne—"ASCII", errors="strict") 

# 将 指定 的 Python 对 象 通过 pickle 序列 化 后 写 入 打开 的 文件 对 象 ， 等 价 于 `Pickler(file, protocoD.dump(obj) 
dump(ob], file, protocol=None, *, fix 1mports=True) 

# 从 打开 的 文件 对 象 中 读 取 pickled 对 象 表现 形式 并 返回 通过 pickle 反 序列 化 后 得 到 的 Python 对 象 
load(file, *., fix 1mports=Trmue, encodine="ASCI", errors—"strict") 


序列 化 与 反 序 列 化 到 文件 的 示例 程序 如 下 : 


>>> Import pickle 

> 

>>> var a= {a':'str, ce: Trme, 'e: 10, Db': 11.1,'d: None, f: [1, 2, 3], 'g':(4., $, 6)} 

# 序列 化 

>>> var b= pickle.dumps(var a) 

>>> var b 
bx80Ww03}qx00GCxO01Ww00Wx00wxw00eqx01K\nX\x01\x00Wxw00Ww00aqix02X\x03Ww00\x00Ww00strqwx03X\Wx01x00\ 


xO0WxO0fq\x04]qx05(K\W01K'\w02K\x03eX\x01\x00x00Ww00gqx06K\w04K\x05K\x06x87qx07XW010000W00bq\ 
x08G@&333333X\WxO1\x00x00Ww00cqitx88XWx01Ww00Ww00w00dqnNu 


# 反 序列 化 

>>> var €¢= pickle.loads(var b) 

>~>~> Var C 

{e': 10, 'a: 'str, f: [1, 2, 3],'g: (4, $, 6), b': 11.1,'c:: Tme, 'd': None} 

将 对 象 内 容 序 列 化 或 持久 化 到 文件 中 ， 以 及 从 文件 反 序 列 化 到 程序 中 ， 示 例 程 序 如 下 : 
>>> 1mport pickle 

>>> 

>>> var a= {a:'str, ec': Tre, 'e: 10, Db': 11.1,'d: None, f: [1, 2, 3], 'g:(4., 3. 6)} 


# 持久 化 到 文件 
>>> With open(‘pickle.txt', wb'") asf: 
pickle.dump(var a.) 


# 从 文件 中 读 取 数 据 
>>> Wlth open( pickle.txt', Tb) asf: 
var b= pickle.load(f) 


>>> war b 


fe 10, 3 'str, f: [1, 2, 3], 'g: (4, $, 6), b' 11.1,'c: Tme, 'd: None} 
> 


4. shelve 模块 
shelve 是 一 种 简单 的 数据 存储 方案 ， 类 似 于 key-value 数据 库 ， 可 以 很 方便 地 保存 Python 
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对 象 ， 在 内 部 通过 pickle 协议 来 实现 数据 的 序列 化 。Shelve 模块 中 只 有 一 个 open0 函 数 ， 这 个 
函数 用 于 打开 指定 的 文件 (一 个 持久 的 字典 ), 然后 返回 一 个 shelf 对 象 .Shelf 对 象 是 一 种 持久 的 、 
类 似 于 字典 的 对 象 。 它 与 dbm 对 象 的 不 同 之 处 在 于 ，value 可 以 是 任意 的 基本 Python 对 象 一 一 
pickle 模块 可 以 处 理 的 任何 数据 ， 这 包括 大 多 数 类 实例 、 递 归 数 据 类 型 和 包含 很 多 共享 子 对 象 
的 对 象 ; 但 key 还 是 普通 的 字符 串 。 


open(filename. flae='c', protocol=None. writeback—False) 


flag 参数 表示 以 何 种 模式 打开 数据 存储 文件 ， 可 取 值 与 dbm.open0 函 数 一 人 怪 ， 如 表 10-7 
所 示 。 


表 10-7 JSON 转 Python 


T 以 只 读 模式 打开 一 个 已 经 存在 的 数据 存储 文件 

W 以 读 写 模 式 打 开 一 个 已 经 存在 的 数据 存储 文件 

C 以 读 写 模式 打开 一 个 数据 存储 文件 ， 如 果 不 存 在 ， 则 创建 一 个 
n 总 是 创建 一 个 新 的 、 至 的 数据 存储 文件 ， 并 以 读 写 模式 打开 


protocol 参数 表示 序列 化 数据 时 使 用 的 协议 版 本 ， 默 认 是 pickle 协议 V3; writeback 参数 表 
示 是 否 开 局 回 写 功能 。 

可 以 把 shelf 对 象 当 作 字典 使 用 一 一 存储 、 更 改 、 查 询 某 个 键 对 应 的 数据 ， 当 操作 完毕 后 ， 
调用 shelf 对 象 的 close0 函 数 即 可 。 当 然 ， 也 可 以 使 用 上 下 文 管理 右 (with 语句 )， 避 免 每 次 都 要 


手动 调用 close0 函 数 。 
下 面 是 对 自 定义 类 型 的 序列 化 和 反 序 列 化 操作 : 
# 目 定 义 类 型 
class Student(object): 


def imt (self, name, age, sno): 
self.name = name 
selt.age = age 
self.sno = sno 


def repr (self): 
returmn 'Student [name: %s, age: %d., sno: "%od| % (self.name, self.age, self.sno) 


# 保存 数据 
tom = Student( Tom. 19. 1) 
Jerry = Student( Jerry’, 17, 2) 
with shelve.open("stu.db") as db: 
db["Tom | = tom 
db[ Jeny|=Jeny 


# 读 取 数据 
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With shelve.open("stu.db") as db: 
print(db['Tom']) 
print(db[ Jerry']) 


执行 以 上 程序 ， 输 出 结果 如 下 : 


Student [name: Tom., age: 19. sno: ] | 
Student [name: Jerry. age: 17. sno: 2| 


这 里 总 结 一 下 : 
e json 模块 第 用 于 编写 Web 接口 ， 将 Python 数据 转换 为 通用 的 JSON 格式 ， 传 递 给 其 他 
系统 或 客户 端 ; 也 可 以 用 于 将 Python 数据 保存 到 本 地 文件 中 ， 缺 点 是 明文 保存 ， 保 密 
性 和 牵 。 男 外 ， 如 果 想 保存 非 内 置 数 据 类 型 ， 则 需要 编写 额外 的 转换 函数 或 类 。 
e pickle 模块 和 shelve 模块 由 于 使 用 特有 的 序列 化 协议 , 序列 化 之 后 的 数据 只 能 被 Python 
识别 ， 因 此 只 能 用 于 Python 系统 内 部 。 男 外 ，Python 2.x 和 Python 3X 默认 使 用 的 序列 
化 协议 也 不 同 , 如 果 想 要 互相 兼容 , 则 需要 在 序列 化 时 通过 protocol 参数 指定 协议 版 本 。 
除了 上 面 这 些 缺 点 外 ，pickle 模块 和 shelve 模块 相对 于 json 模块 的 优点 在 于 , 对 于 自 定 
义 类 型 可 以 直接 序列 化 和 反 序列 化 ， 不 需要 编写 额外 的 转换 函数 或 类 。 
e shelve 模块 可 以 看 作 pickle 模块 的 升级 版 ,因为 shelve 使 用 的 就 是 pickle 的 序列 化 协议 ， 
但 是 shelve 比 pickle 提供 的 操作 方式 更 加 人 简单、 方便 。shelve 模块 相对 于 其 他 两 个 模块 
在 将 Python 数据 持久 化 到 本 地 磁盘 时 有 一 个 很 明显 的 优点 ， 就 是 允许 我 们 可 以 像 操作 
字典 一 样 操作 序列 化 的 数据 ， 而 不 必 一 次 性 保存 或 谈 取 所 有 数据 。 
建议 : 
需要 与 外 部 系统 交互 时 使 用 json 模块 ; 需要 将 少量 、 简 单 的 Python 数据 持久 化 到 本 地 磁盘 
时 可 以 考虑 使 用 pickle 模块 ; 需要 将 大 量 Python 数据 持久 化 到 本 地 磁盘 或 者 需要 一 些 简 单 的 类 
似 数 据 库 的 增删 改 查 功能 时 ， 可 以 考虑 使 用 shelve 模块 


目录 操作 


Windows、Linux、UNIX 和 Mac OS XX 中 的 文件 系统 有 许多 共同 点 ， 但 是 它们 的 茶 些 规 则 、 
约定 和 功能 略 有 不 同 。 例 如 ，Windows 使 用 反 斜 杠 将 路 径 中 的 目录 名 称 隔 开 ， 而 Linux 和 
UNIX(Mac OS X 是 UNIX 的 一 种 ) 使 用 正 斜 杜 。 除 此 之 外 ，Windows 使 用 驱动 器 名 称 ， 而 其 他 
系统 则 不 用 。 这 些 不 同 之 处 是 编写 跨 平 台 程 序 的 障碍 。Python 将 路 径 和 目录 操作 的 烦琐 细节 隐 
藏 在 os 模块 中 ， 以 方便 程序 员 使 用 。 然 而 ， 使 用 os 模块 并 不 能 解决 所 有 移植 问题 ，os 模块 中 
的 一 些 函 数 并 不 是 在 所 有 平台 上 都 可 用 。 本 节 仅 描述 在 所 有 平台 上 都 可 用 的 函数 。 

即使 打算 仅 在 一 个 平台 上 使 用 程序 ， 并 且 预 计 能 够 避免 大 多 数 这 样 的 问题 ， 但 如 果 程 序 很 
有 用 ， 也 很 可 能 某 天 有 人 会 在 其 他 平台 上 党 试 运行 程序 。 因 此 ， 最 好 使 用 os 模块 ， 它 提供 了 许 
多 有 用 的 服务 。 不 要 忘记 ， 首 先 要 导入 os 模块 ， 然 后 才能 使 用 。 

os 模块 中 的 函数 在 失败 时 会 抛 出 OSError 异常 。 如 果 希 望 程序 在 出 错时 行为 友好 ， 那 么 必 
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须 处 理 这 个 异常 。 与 IOErmor 一 样 ， 异 第 的 字符 串 表 示 描 述 了 过 到 的 问题 。 
10.3.1 路径 


模块 os 包含 另 一 个 模块 os.path, 它 提供 了 操作 路 径 的 函数 。 由 于 路 径 也 是 字符 串 ， 因 此 可 
以 使 用 普通 的 字符 串 操 作 方 法 组 合 和 分 解 文件 路 径 。 但 是 如 果 这 样 ， 代 码 可 能 不 易 移植 ， 也 不 
能 处 理 ospath 知道 的 一 些 特殊 情形 。 使 用 ospath 操作 路 径 ， 可 使 程序 易于 移植 ， 且 可 以 处 理 
一 些 特殊 情形 。 

使 用 os.pathjoin 可 将 目录 名 称 组 合成 路 径 。Python 使 用 适合 操作 系统 的 路 径 分 隔 符 。 在 使 
用 之 前 不 要 忘记 导入 ospath 模块 。 例 如 ， 输 入 如 下 代码 : 

>>> Import 0s.path 


>>> os.path join("snakes", "Python") 
'snakes\Python' 


在 Linux 系统 上 ， 在 os.path.join 中 使 用 相同 的 参数 会 得 到 如 下 不 同 结果 : 

>>> Import os.path 

>>> 0s.path.jom("snakes". "Python ) 

'Snakes/ Python 

可 以 指定 多 于 两 个 的 名 称 。 

函数 os.path.split0 有 具有 相反 的 功能 ， 它 将 路 径 的 最 后 一 个 组 件 提取 出 来 。 该 函数 返回 包含 
两 项 的 元 组 : 父 目录 的 路 径 以 及 最 后 一 个 路 和 从 组件 。 示 例如 下 : 


>>> 0s.path.split("C:\Proeram Files\Python3\LIib") 
(C:\Program Files\Python37", Lib') 


在 UNIX 或 Linux 系统 上 的 结果 如 下 : 


>>> 0s.path.split("/usr/bm/python") 

(Cusrbin. python ) 

目 动 分 解 序 列 在 这 里 派 上 了 用 场 .os.path.split0 函 数 返回 一 个 元 组 , 该 元 组 可 分 成 儿 个 部 分 ， 
分 别 赋 予 等 写 左 边 的 组 件 : 


>>> parent path. name = os.path.split("C:\Proeram Files\Python30\Lib") 

>>> print(parent path) 

C:\Program Files\python37 

>>> prnt(name) 

Lib 

尽管 ospath.splitO 国 数 仅 将 路 径 的 最 后 部 分 隔 开 ， 但 是 有 时 候 也 许 希 望 将 一 个 路 径 完 全 分 
解 为 看 干 目 录 的 名 称 。 编 写 一 个 这 样 的 图 数 并 不 困难 ， 只 需要 对 该 路 径 调用 ospath.splitO 函 数 ， 
之 后 对 父 目 录 的 路 径 再 次 调用 os.path.split0 函 数 ， 依 此 类 推 ， 直 到 得 到 根 目 录 。 实 现 该 功能 的 
一 种 得 体 方式 是 使 用 递归 函数 ， 形 式 如 下 : 


det split fully(path): 


-a 


parent path, name = os.path.split(path) 
fname 一 ””: 


TIetum (parent path., ) 
else: 
Tetum split fully(parent path) + (name, ) 


最 关键 的 是 最 后 一 行 ， 此 处 ， 函 数 调用 目 身 将 父 目 录 分 解 成 各 个 组 件 。 路 径 的 最 后 一 个 组 
件 name 被 添加 到 完全 分 解 的 父 路 径 后 面 。split fully 中 间 的 行 阻止 函数 无 限 次 地 调用 自身 。 当 
os.path.split0 函 数 不 能 继续 分 解 一 个 路 征 时 ， 它 返回 的 第 二 个 组 件 为 宇 ，split fully 注意 到 这 一 
点 并 只 返回 父 路 径 ， 而 不 再 调用 目 身 。 

函数 可 以 安全 地 调用 上 自 结 ， 因 为 Python 记录 了 国 数 的 每 一 个 运行 实例 的 参数 和 局 部 变量 ， 
即使 运行 实例 是 从 另 一 个 运行 实例 中 调用 的 。 在 这 种 情形 下 ， 当 split_fully 调用 目 身 时 ， 即 使 
内 部 (第 二 个 ) 实 例 给 name 赋 子 了 一 个 不 同 的 值 ， 外 部 (第 一 个 ) 实 例 也 不 会 丢失 name 的 值 ， 因 
为 每 个 图 数 的 运行 实例 都 有 上 自己 的 变量 name 的 副本 。 当 内 部 实例 返回 后 ， 外 部 实例 继续 使 用 
它 在 进行 递归 调用 时 拥有 的 name 变量 的 值 。 

编写 递归 函数 时 ， 要 确保 它 不 会 无 限 次 调用 自 二 。 无 限 次 调用 目 号 是 很 糟 糙 的， 因为 永远 
都 不 会 返回 结果 (实际 上 ， 这 种 情形 下 ，Python 会 用 完 记 录 所 有 调用 的 空间 ， 并 抛 出 异常 )。 
split_fully 不 会 无 限 次 调用 上 自 号， 因为 最 终 的 路 径 足 够 短 ， 并 是 name 会 变 成 一 个 空 的 字符 串 ， 
此 时 split-fully 不 会 再 调用 自身 ， 而 是 直接 返回 。 

split-fully 中 有 两 处 使 用 单个 元 素 的 元 组 ， 注 意 必须 在 圆 括号 中 包含 一 个 有 逗号。 没有 逗号 ， 
Python 会 将 圆 括 与 解释 为 普通 的 分 组 圆 括号 ， 残 像 数学 表达 式 中 那样 : (name, ) 是 一 个 包含 单个 
元 素 的 元 组 ， 但 (name) 与 name 完全 相同 。 

这 里 有 一 个 可 以 运行 的 函数 : 

>>> spht fully("C:\Program Files\Python3 Lib") 

(CN Program Files', Python37. Lib’") 


当 有 一 个 文件 名 称 时 ， 可 以 使 用 os.path.splitext0 函 数 分 解 出 它 的 扩展 名 : 


>>> os.path.splitext("image.jpe") 


(image' "jpg) 
对 splitext0 函 数 的 调用 会 返回 一 个 包含 两 个 元 素 的 元 组 ， 因 此 可 以 用 上 面 的 方式 提取 出 扩 
展 名 : 


>>> parts = 0s.path.splitext("image.jpe") 
>>> extension = parts[1] 


实际 上 ， 并 不 需要 变量 parts。 可 以 从 splitext0 函 数 的 返回 值 直接 提取 出 第 二 个 组 件 


extenslion: 
>>> extension = 0s.path.splhitext("1mage.jpe")[1] 
os.path.normpath0 函 数 也 能 派 上 用 场 ， 它 可 以 规范 化 或 “清理 ”路 径 : 


>>> print(os.path.normpath(1"C:\Program Files\Perl\. ‘Python37")) 
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CAPropsram Files\Python37 


注意 如 何 通 过 备份 目录 组 件 去 挤 “..”， 以 及 如 何 修复 双 分 隔 符 。 函 数 os.path.abspath0 与 
os.path normpathO 类 似 ， 它 将 相对 路 径 (相对 于 当前 目录 的 路 径 ) 转 变 为 绝对 路 径 ( 从 驱动 器 或 文 
件 系 统 的 根 目录 开始 ): 

>>> print(os.path.abspath("other stuff’)) 

C.\Proeram Files\Python37N\other stu{ff 

输出 取决 于 调用 os.path.abspath0 函 数 时 的 当前 路 径 。 也 许 你 已 经 注意 到 ， 即 使 在 Python 日 
录 下 没有 名 为 other stuff 的 文件 或 目录 存在 ， 这 个 函数 也 仍然 可 以 正 常 工作 。os.path 下 的 所 有 
路 径 操 作 函 数 都 不 检查 止 在 操作 的 路 径 是 否 真 正 存 在 。 

可 以 使 用 ospath_existsO 国 数 判断 某 个 路 径 是 否 真 正 存 在 ， 它 仅 商 单 地 返回 True 或 False: 


>>> os.path.exists("C:\Windows") 

True 

>>> 0s.path.exists("C:\Windows\reptiles") 
False 


当然 ， 如 果 使 用 的 不 是 Windows， 或 者 Windows 安装 在 另 一 个 目录 (例如 C\WinNT) 中 ， 
这 两 个 调用 都 会 返回 False! 


10.3.2 目录 内 容 


现在 你 知道 了 如 何 构造 任意 路 径 并 且 将 它们 分 开 ， 但 是 如 何 才能 找 出 硬盘 上 实际 存在 哪些 
内 容 呢 ? os listdir 模块 会 返回 一 个 目录 下 所 有 的 条 目 ， 包 括 文件 和 子 目 录 等 内 容 。 下 面 的 代码 
将 得 到 一 个 目录 下 的 条 目 列表 。 在 Windows 系统 中 ， 可 以 列 出 Python 安装 目录 下 的 内 容 : 

>>> 0s.listdr("C:\Python37") 

[Chapter $ 'Chapter 6', Chapter 7', DLLS Doc', ham' inchude', Lib', Libs', LICENSE .txt', maybe NEWS .txt. 
Python_exe' pythonw.exe’, README.txt, tel', 'Test', "Test.py', ‘test.txt', ‘test2.txt', ‘testé.txt', ‘tester.py', ‘test.txt', "Tools,, 
‘woxpopen.exe'| 


注意 ， 在 不 同 机 右上 的 运行 结果 有 可 能 人 不同， 因为 显示 的 结果 取决 于 目录 下 的 文件 。 

如 果 使 用 其 他 操作 系统 ， 或 者 在 其 他 目录 下 安装 Python， 请 将 示例 中 的 路 径 蔡 换 为 其 他 路 
径 。 使 用 “.” 可 以 列 出 当前 目录 。 当 然 ， 如 果 使 用 不 同 的 目录 ， 将 会 得 到 不 同 的 条 目 列表 。 

无 论 哪 种 情况 ， 都 应 该 注意 一 些 重要 的 事情 。 首 先 ， 返 回 的 结果 是 条 目的 名 称 而 不 是 完整 
路 径 。 如 果 需 要 茶 个 条 目的 完整 路 径 ， 就 必须 使 用 os.path.join 进行 构造 。 其 次 ， 结 果 中 既 有 文 
件 名 称 也 有 目录 名 称 , 从 os.listdir 的 结果 中 无 法 区 分 两 者 。 最 后 , 注意 结果 中 不 包含 “.” 和 “..”， 
它们 代表 当前 目录 及 其 父 目 录 的 特殊 目录 名 称 。 

编写 一 个 函数 ， 列 出 某 个 目录 中 的 内 容 ， 但 是 需要 打印 出 完整 路 径 ， 而 不 是 仅 打印 文件 和 
子 目 录 的 名 称 ， 并 且 要 求 每 行 打 印 一 个 条 目 ， 示 例 程 序 如 下 : 

def prmt dxr(dir path): 

for name m os.lhistdir(dir path): 
print(os.path.jom(dir path, name)) 


和 


在 os.listdir 返回 的 列表 上 循环 调用 该 图 数 ， 并 且 对 每 个 条 目 调用 ospathjom， 在 打印 之 前 
构造 完整 路 径 。 尝 试 下 面 的 代码 ; 

>>> prmt da("C:\Python30") 

CpPython37\'DLLs 

CPpPython37\'Doc 

C Python37ham 

CAbython37wunclude 

CPpPython37\Lib 

Cpython3 lbs 

C:\python3 NLICENSE txt... 

以 上 代码 并 不 能 保证 os.listdir 返回 的 条 目 列表 以 某 种 特定 的 方式 排序 ， 也 就 是 说 ， 顺 序 是 
任意 的 。 可 能 希望 条 目 以 某 种 特定 顺序 排序 ， 以 满足 应 用 需求 。 由 于 是 字符 串 列表 ， 因 此 可 以 
使 用 sorted0 函 数 进 行 排序 。 

默认 情况 下 ， 得 到 的 结果 按 字 母 表 排序 ， 并 区 分 大 小 写 : 

>>> sorted(os.listdr("C:\Python37")) 

[DLLs' ‘Doc', LICENSE.txt, Lib', NEWS.txt, README .txt', ‘Removepywin32.exe', 'Scripts', "Tools', "mclude. 
Libs', py.lco ,pyc.lco, 'python.exe', pythonw.exe', pywin32-winmst.log', 'tcl, woOxpopen.exe'| 


10.3.3 ”获取 文件 信息 


可 以 很 容易 地 判断 出 路 径 是 指 回 文件 还 是 指 癌 目录 。 如 果 指 同文 件 ，ospathisfile 将 返回 
True;， 如 果 指 向 目录 ，ospath isdir 将 返回 True。 如 果 路 径 不 存在 ， 它 们 都 返回 False， 例 如 


>>> 0s.path.1sfille("C:\Wmdows") 


False 
>>> 0sDath isdir(CNWindows") 
True 


在 某 些 平台 上 ， 一 个 目录 也 许 包含 许多 其 他 类 型 的 条 目 ， 例 如 符号 链接 、 套 接 字 、 设 备 等 
这 些 条 目的 具体 含义 取决 于 特定 的 平台 ， 相 关内 容 比较 复杂 ， 这 里 不 进行 讨论 。 然 而 ，os 模块 
为 检查 这 些 条 目 提供 了 支持 ， 请 查阅 文档 以 了 解 与 平台 有 关 的 细节 。 


递归 目录 列表 


可 以 将 os.path.isdir 和 os.listdir 结合 起 来 实现 一 些 有 用 的 操作 ， 例 如 ， 递 归 地 处 理子 目录 。 
为 此 ， 编 写 递 归 函 数 很 有 用。 当 函 数 找到 子 目 录 时 ， 函 数 调 用 目 和 映 ， 列 出 子 目 录 的 内 容 : 


def prnt tree(dir path): 
tor name Im os.listdir(dxr path): 
full path = os.path.jom(dir path, name) 
print(full path) 
lf os.path.isdir(full path): 
print tree(ftull path) 
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注意 上 面 的 函数 与 之 前 编写 的 print_dir0 函 数 十 分 类 似 。 然 而, 这 个 函数 为 每 个 条 目 构造 了 
完整 路 径 fll path， 因 为 这 既 符合 打印 的 需求 ， 也 考虑 到 了 子 目 录 的 需求 。 最 后 两 行 代 码 检查 
是 否 是 子 目录 ， 如 果 是 ， 该 函数 束 在 继续 运行 之 前 通过 调用 目 身 列 出 子 目录 的 内 容 。 确 保 没 有 
对 一 樟 非 营 大 的 目录 树 调 用 该 函数 ， 人 否则 ， 将 个 得 不 等 待 打印 出 树 中 每 个 子 目 录 和 文件 的 完整 
路 径 。 

模块 ospath 中 的 其 他 函数 提供 了 关于 文件 的 信息 。 例如 ，os.path.getsize 在 不 必 打 开 和 扫描 
茶 个 文件 的 情况 下 以 字 节 为 单位 返回 该 文件 的 大 小 。 使 用 os.path.getmtime 可 以 得 到 文件 上 次 被 
修改 的 时 间 。 返回 的 值 是 从 1970 年 起 到 文件 上 次 被 修改 的 时 间 之 间 的 秒 数 ,而 这 不 是 用 户 喜欢 
的 日 期 格式 。 必 须 调用 另 一 个 函数 tme.ctime0,， 将 结果 转换 为 易于 理解 的 形式 (不 要 态 了 首先 要 
导入 time 模块 )。 以 下 示例 和 输出 了 Python 安装 目录 上 次 被 修改 的 时 间 ， 这 可 能 是 在 计算 机 上 安 
交 Python 的 日 期 和 时 间 : 

>>> Import time 

>>> mod time = os.path.geetmtime("C:\Python37") 

>>> print(time.ctime(mod tme)) 

Thu Mar 1$ 01:36:26 2009 

现在 你 知道 了 如 何 修 改 print_dir0 函 数 来 打印 目录 的 内 容 ， 包 括 每 个 文件 的 大 小 和 修改 时 
间 。 为 了 简单 ， 下 面 的 版 本 只 打印 条 目的 名 称 ， 而 不 打印 它们 的 完整 路 径 : 

def prmt dr nfo(dir path): 

for name m os.listdir(dir path): 
full path = os.path.jom(dir path. name) 
file size = os.path.eetsize(full path) 
mod time = time.ctime(os.path.getmtime(full path)) 
print("%o-32s: %8d bytes. modified %%s" % (name. flle size. mod tme)) 

最 后 一 条 语句 使 用 了 前 面 介绍 的 Python 内 阐 的 字符 串 格 式 化 方法 ， 以 产生 整洁 的 输出 。 如 

果 和 希望 输出 其 他 文件 信息 ， 请 浏览 ospath 模块 的 文档 ， 以 学 习 如 何 获取 这 些 信 息 。 


10.3.4 重 命名 、 移 动 、 复 制 和 删除 文件 

模块 shutil 中 包含 操作 文件 的 函数 。 可 以 使 用 函数 shutilmove 重 命名 文件 : 

>>> Import shutl 

>>> shutil.move("server.loe". "server.log.backup") 

也 可 以 使 用 它 将 一 个 文件 移动 到 男 一 个 目录 下 : 

>>> shutil.move("old mall.txt", "C:\data\archive\W") 

从 上 文 可 知 ，os 模块 也 包含 一 个 可 以 重 命 名 和 移动 文件 的 函数 os.rename。 一 般 应 当 使 用 
shutilmove， 因 为 使 用 os.rename 可 能 无 法 指定 一 个 目录 名 称 作 为 目标 ， 而 且 在 某 些 系统 上 ， 
osTename 不 能 将 文件 移动 到 男 一 个 磁盘 或 文件 系统 中 。 

shutil 模块 还 提供 了 copy0 函 数 ， 用 于 将 一 个 文件 复制 为 具有 新 名 称 的 另 一 个 文件 , 或 者 复 
制 到 新 目录 下 。 可 以 简单 地 使 用 如 下 代码 : 
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>>> shutl.copy("Important.dat". "C:\backups") 

删除 文件 是 最 简单 的 操作 ， 只 需要 调用 osTemove 即 可 : 

>>> 0s.remove("Junk.dat") 

UNIX 黑客 可 能 更 喜欢 osunlink， 它 能 完成 相同 的 操作 。 
10.3.5 ”创建 和 删除 目录 

创建 空 目 录 甚 至 比 创 建 空 文件 容易 。 只 需要 调用 osmkdir 就 可 以 实现 该 操作 。 然 而 ， 要 创 
建 的 目录 的 父 目 录 首 先 要 存在 。 如 果 父 目录 Ci\photos\zoo 不 存在 ， 下 面 的 代码 将 引发 异 芝 : 

>>> 0SInkdrC:wphotoswzoowsnakes ) 

可 以 使 用 os.mkdir 函数 创建 父 目录 , 但 一 种 更 简单 的 方法 是 使 用 os.makedirs 函数 ， 该 函数 
可 以 创建 不 存在 的 父 目录 。 例 如 ， 下 面 的 代码 将 在 必要 的 时 候 创 建 C:\photos 和 C:\photos\zoo: 

>>> 0s.makedirs("C:\photos\zoo\'snakes") 

使 用 函数 os.rmdir 删除 目录 。 该 函数 仅 对 空 目录 有 效 ， 如 果 要 删除 的 目录 不 为 定 ， 首 先 需 
要 删除 该 目录 中 的 内 容 。 

>>> Os.Imdir("C:\photos\zoo\snakes") 

上 面 的 代码 仅 会 删除 子 目 录 snakes。 

有 一 种 方法 可 以 在 目录 包含 其 他 文件 和 子 目录 的 情况 下 将 该 目录 删除 。 函 数 shutilLrmtree 
可 以 实现 该 操作 。 然 而 ， 使 用 该 函数 时 要 谨慎 。 如 果 犯 了 编程 或 输入 错误 ， 回 该 图 数 传 入 错误 
的 路 径 ， 它 将 删除 一 整 组 文件 ， 你 甚至 不 知道 发 生 了 什么 情况 ! 例如 ， 下 面 的 代码 会 删除 完整 
的 图 片 集 : 


>>> shutil. rmtree("C:\\photos") 


10.3.6 ”文件 通配符 


如 果 使 用 过 Windows 系统 的 命令 行 提 示 符 ， 或 者 使 用 过 GUN/Linux、UNIX、Mac OS XX 
的 命令 行 shell， 可 能 看 到 过 通配符 模式 。 通 配 符 是 一 些 特殊 字符 ， 例 如 * 和 ?， 可 以 使 用 它们 匹 
配 许多 名 称 类 似 的 文件 。 例如， 使 用 模式 P* 可 以 匹配 名 称 以 P 开头 的 所 有 文件 ， 使 用 * txt 可 以 
匹配 所 有 后 级 名 为 .txt 的 文件 。 

通 配 (globbing) 是 黑客 们 的 行 话 ， 用 来 表示 在 文件 名 称 模式 中 展开 通配符 。Python 在 模块 
glob 中 提供 了 名 称 也 为 glob 的 函数 ， 实现 了 对 目录 内 容 进行 通 配 的 功能 。glob.glob 函数 接收 模 
式 作 为 输入 ， 并 返回 所 有 匹配 的 文件 名 和 路 径 名 列表 ， 这 与 os.listdir 类 似 。 


注意 : 
在 Windows 操作 系统 中 ， 模 式 M* 可 以 匹配 名 称 以 m 和 M 开头 的 所 有 文件 ， 因 为 文件 名 
称 和 文件 名 称 通 配 是 不 区 分 大 小 写 的 。 在 大 多 数 其 他 操作 系统 中 ， 通 配 是 区 分 大 小 写 的 。 
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例如 ， 试 着 使 用 下 面 的 命令 ， 列 出 C:\Program Files 目录 下 名 称 以 M 开头 的 所 有 条 目 : 
>>> Import glob 


>>> glob.eglob("C:\Program Files\M*") 
[C:\Program Files\Messenger', 'C:\Proeram Flles\Microsoft Office', 'C:\Program Files\Mozilla Firefox'| 


由 于 计算 机 可 能 安装 了 不 同 的 软件 ， 因 此 输出 可 能 与 上 面 的 不 同 。 可 以 看 到 glob.glob 返回 
了 符合 模式 的 包含 磁盘 驱动 符 和 目录 名 称 的 路 径 ， 这 与 os.listdir 不 同 ， 后 者 只 返回 指定 目录 下 
的 名 称 。 

表 10-6 列 出 了 通 配 模式 中 可 以 使 用 的 通配符 。 这 些 通配符 与 操作 系统 的 命令 shell 中 的 通 
配 符 并 不 一 定 完全 一 致 ， 但 是 Python 的 glob 模块 在 所 有 的 平台 上 都 使 用 相同 的 语法 。 注 意 ， 
通 配 模式 的 语法 与 正则 表达 式 的 语法 类 似 但 不 相同 。 


表 10-6 ”通配符 
通配符 | 匹配 示例 
* * mx* 匹 配 扩展 名 以 m 开头 的 名 称 
? 22? 匹 配 恰好 包含 3 个 字符 的 名 称 
Lal 方 括 号 中 列 出 的 任意 单个 字符 [AEIOU]* 匹 配 以 大 写 的 元 音字 母 开 头 的 名 称 
*[1s] 匹 配 不 以 s 结尾 的 名 称 


也 可 以 在 方 插 号 之 间 使 用 共 个 范围 内 的 学 得 。 例 如 ，[m-p] 匹 配 m、n、o、Pp 中 的 任意 单个 
字符 ，[!0-9] 匹 配 数 字 以 外 的 任意 字符。 
通 配 是 为 文件 操作 选择 一 组 相似 文件 的 较为 便捷 的 方法 。 例 如 ， 要 删除 目录 Ci\source\ 中 所 
有 扩展 名 为 .bak 的 备份 文件 ， 只 需要 执行 如 下 两 行 代 但 : 
>>> for path m glob.glob("C:\\'source\W .bak"): 
os.remove(path) 


通 配 相 比 oslistdir 的 功能 强大 得 多 ， 因 为 可 以 在 目录 或 子 目 录 的 名 称 中 指定 通配符 。 对 于 
这 样 的 模式 ，glob.glob 可 以 返回 多 个 目录 下 的 路 径 。 例 如 ， 下 面 的 代码 返回 当前 目录 的 所 有 子 
目录 中 扩展 名 为 .txt 的 文件 : 


>>> glob.glob(™*\* .txt") 


轮换 文件 


下 面 处 理 更 难 完成 的 文件 管理 任务 。 假 设 需要 保留 一 个 文件 的 多 个 老 版 本 。 例 如 ， 系 统管 
理 员 要 保留 老 版 本 的 系统 日 志文 件 。 通 第 ， 旧 版 文件 的 名 称 中 会 有 一 个 数字 后 缀 ， 例 如 
web.log.1、web.log.2 等 ， 其 中 较 大 的 数字 代表 较 老 的 版 本 。 为 了 给 文件 的 新 版 本 预 留 空间 ， 这 
些 老 版 本 被 轮换 : 目前 的 版 本 web.log 变 成 了 web.log.1， 而 Web.log.1 则 变 成 了 web.log.2, 依 此 

手动 实现 该 功能 非常 乏味 ， 但 是 Python 却 可 以 很 快 地 实现 。 有 几 个 环 手 的 问题 需要 考虑 。 


ES 


Zr 


首先 ， 文 件 的 当前 版 本 与 老 版 本 的 命名 方式 不 同 : 老 版 本 有 一 个 数字 后 级 ， 而 当前 版 本 没有 。 
解决 这 个 问题 的 一 个 方法 是 将 当前 版 本 作为 版 本 0。 函数 make_version pathO 负 责 为 当前 版 本 和 
老 版 本 构造 正确 的 路 径 。 

男 一 个 不 易 注 意 的 地 方 是 必须 确保 首先 要 重 命 名 老 版 本 。 例 如 ， 如 果 在 重 命 名 web.log.2 
之 前 将 web.log.1 重 命名 为 web.log.2， 后 者 将 被 重 写 ， 之 前 的 内 容 就 会 丢失 ， 这 并 不 是 我 们 希 
望 的 结果 。 递 归 函 数 将 再 次 伸 出 援手 。 递 归 函 数 可 以 调用 自身 ， 在 重 写 下 一 个 老 版 本 的 日 志文 
件 之 前 轮换 : 


iimport os 


def make version path(path, version): 
if version 一 0: 
# No suffix for verslon 0. the current version. 
return path 
else: 
# Append a suffix to mdicate the older version. 
Tetum path + "." + str(version) 


def rotate(path., version—0): 
# Construct the name of the version WeTe rotatine. 
old path = make version path(path., version) 
1{ not os.path.exists(old path): 
# It doesn't exist, so complam. 
ralse IJOEITOT( "9%0s' doesn't exist" % path) 
# Construct the new Verslon name for this file. 
new path= make version path(path., version + 1) 
# Is there already a version with this name? 
1{ os.path.exists(new path): 
# Yes. Rotate lt out ofthe Way first! 
rotate(path, version + 1) 
# Now we can rename the version safely. 
shutil.move(old path, new path) 


化 几 分 钟 时 间 研 究 一 下 上 面 的 代码 和 注释 。rotate0 函 数 使 用 了 递归 函数 的 通用 技术 : 第 二 
个 参数 用 于 处 理 递归 情形 ， 在 这 个 示例 中 ， 文 件 的 版 本 号 被 轮换 。 该 参数 的 默认 值 为 0， 表 示 
文件 的 当前 版 本 。 当 调用 rotate0 函 数 时 (与 函数 调用 上 自己 的 情况 不 同 )， 不 需要 指定 第 二 个 参数 
的 值 。 例 如 ， 可 以 直接 调用 rotate("web.log")。 

rotate0 函 数 检查 止 在 被 轮换 的 文件 是 否 确 实 存 在 ， 如 果 不 存在 ， 则 引发 异常 。 假 设 希 望 轮 
换 一 个 不 确定 是 否 存 在 的 系统 日 志文 件 。 解 决 该 问题 的 一 种 可 能 方法 是 在 该 系统 日 志文 件 不 存 
在 时 , 创建 一 个 空 的 系统 日 志文 件 。 回忆 一 下 ， 当 以 写 方式 打开 一 个 并 不 存在 的 文件 时 , Python 
会 目 动 创建 它 。 如 采 没 有 回 新 文件 中 输入 内 容 ， 新 文件 将 是 空 的 。 下 面 是 一 个 用 于 轮换 可 能 1 
在 的 日 志文 件 的 函数 ， 如 果 不 存 在 ， 则 首先 要 创建 系统 日 志文 件 。 
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def rotate log flle(path): 


1{ not os.path.exists(path): 
# The flle ls mmssng. so create 1t. 


new file = flle(path, "w") 
# Close the new flle mmediately, which leaves 1t empty. 
del new file 

# Now rotate 1t. 

rotate(path) 


本 音 小 结 


在 编程 过 程 中 ， 文 件 既 可 以 作为 要 处 理 信息 的 来 源 ， 也 可 以 作为 处 理 结果 的 存储 目的 地 。 
因此 ， 文 件 及 文件 路 径 一 一 目录 的 操作 尤为 重要 。 

Python 提供 了 一 套 民 好 的 文件 管理 模块 。 本 章 首 先 介绍 的 是 基本 文件 操作 , 包括 打开 文件 、 
关闭 文件 、 文 件 读 写 模 式 、 文 件 读 写 过 程 中 用 到 的 缓冲 。 然 后 介绍 了 基本 文件 方法 ， 如 读 文 件 、 
写 文 件 、 重 命名 、 对 数据 进行 序列 化 , 以 及 对 持久 化 到 文件 中 的 信息 进行 反 序 列 化 以 读 入 Python 
程序 等 。 最 后 介绍 目录 操作 ， 内 容 包 括 路 径 、 目 录 内 容 、 获 取 目 录 中 的 文件 信息 ; 目录 和 文件 
的 重 命 名 、 移 动 、 复 制 和 删除 操作 ; 文件 通 配 得 的 使 用 。 

通过 本 章 的 学 习 ， 大 家 应 能 了 解 文件 和 目录 在 编程 过 程 中 主要 用 于 存储 什么 样 的 信息 ， 能 
够 熟练 掌握 文件 及 目录 操作 。 


思考 与 练习 


1. 举例 说 明 Python 编程 中 的 文件 读 写 及 相关 的 文件 对 象 方法 。 

2. 编写 程序 ， 使 用 不 同 编码 读 写 .txt 文件 。 

3. 编写 程序 ， 通 过 传 入 裔 要 授 历 的 目录 ， 列 出 目录 下 的 所 有 文件 并 统计 文件 数 。 
4. 编写 程序 ， 实 现 创建 文件 和 退 加 文件 内 容 。 

5. 编写 程序 ， 删 除 空 的 文件 和 文件 夹 。 
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多 进程 和 多 线程 是 操作 系统 中 的 重要 概念 ， 主 要 是 为 了 在 同一 时 刻 同时 执行 多 个 任务 ， 以 
提高 系统 的 各 吐 量 ， 提 高 资源 利用 率 。 

多 线程 编程 技术 可 以 实现 代码 并 行 ， 优 化 处 理 能 力 ， 同 时 可 以 将 代码 划分 为 功能 更 小 的 模 
块 ， 使 代码 的 可 重用 性 更 好 。 本 章 介 绍 Python 中 的 多 线程 编程 。 多 线程 一 直 是 Python 学 习 中 
的 重点 和 难点 ， 同 学 们 需要 反复 实践 和 研究 。 


本 章 的 学 习 目 标 : 

了 解 进程 和 线程 的 概念 ， 以 及 多 线程 和 多 进程 的 概念 ; 
了 解 Python 中 的 线程 模块 ; 

掌握 thread 模块 的 使 用 ; 

掌握 threading 模块 的 使 用 ; 

掌握 线程 同步 的 方法 ; 

掌握 线程 优先 级 队列 ; 

了 解 线程 和 进程 的 比较 ; 

掌握 Python 多 线程 编程 技术 的 应 用 。 


进程 和 线程 


在 学 习 多 线程 的 使 用 之 前 ， 需 要 先 了 解 任 务 、 进 程 、 线 程 、 多 进程 和 多 线程 的 概念 。 
11.1.1 进程 


进程 (Process) 是 计算 机 中 的 程序 在 茶 数据 集合 上 的 一 次 运行 活动 ， 是 系统 进行 资源 分 配 和 
调度 的 基本 单位 ， 是 操作 系统 结构 的 基础 ， 有 时 候 也 称 为 重量 级 进程 。 在 早期 面 癌 进程 设计 的 
计算 机 结构 中 ， 进 程 是 程序 的 基本 执行 实体 ;在 当代 面 问 线程 设计 的 计算 机 结构 中 ， 进 程 是 线 
程 的 容 右 (有 关 线 程 的 内 容 在 11.1.2 节 介 绍 )。 程 序 是 指令 、 数 据 及 其 组 织 形 式 的 描述 ， 进 程 是 
程序 的 实体 。 

每 个 进程 都 有 目 己 的 地 址 空间 、 内 存 、 数 据 栈 以 及 记录 运行 轨迹 的 辅助 数据 ， 操 作 系 统管 


理 运行 的 所 有 进程 ， 并 为 这 些 进程 公平 分 配 时 间 。 进 程 可 以 通过 fork 和 spawn 操作 完成 其 他 任 
务 。 因 为 各 个 进程 都 有 自己 的 内 存 空间 、 数 据 栈 等 ， 所 以 只 能 使 用 进程 间 通信 PC)， 而 不 能 中 
接 共享 信息 。 


11.1.2 ”线程 


线程 (Thread， 有 时 也 称 为 轻 量 级 进程 ) 跟 进程 有 些 相似 ,不 同 的 是 ， 所 有 线程 运行 在 同一 个 
进程 中 ， 共 享 运 行 环境 。 

线程 有 开始 、 顺 序 执行 和 结束 三 部 分 ， 有 目 己 的 指令 指针 ， 记 录 运 行 到 了 什么 地 方 。 线 程 
在 运行 中 可 能 出 现 抢占 (中 断 ) 情 况 或 暂时 被 挂 起 (睡眠 )， 从 而 让 其 他 线程 运行 ， 这 称 为 让 步 。 一 
个 进程 中 的 各 个 线程 之 间 共 享 同 一 块 数据 空间 ， 所 以 线程 之 间 可 以 比 进程 之 间 更 方便 地 共享 数 
据 和 相互 通信 。 

线程 一 般 是 并 发 执行 的 。 正 是 由 于 这 种 并 行 和 数据 共享 机 制 ， 使 得 多 个 任务 的 合作 变 得 可 
能 。 实 际 上 ， 在 单 CPU 系统 中 ， 真 正 的 并 发 并 不 可 能 ， 每 个 线程 会 被 安排 成 每 次 只 运行 一 小 会 
儿 ， 然 后 就 把 CPU 让 出 来 ， 让 其 他 线程 运行 。 

在 进程 的 整个 运行 过 程 中 , 每 个 线程 都 只 做 自己 的 事 ， 需 要 时 再 跟 其 他 线程 共享 运行 结果 。 
多 个 线程 共同 访问 同一 块 数据 空间 并 不 是 完全 没有 和 危险 ， 由 于 数据 访问 的 顺序 不 一 样 ， 因 此 可 
能 导致 数据 结果 不 一 致 ， 这 叫 作 帝 态 条 件 。 大 多 数 线程 库 中 都 有 一 系列 不 同 原 语 ， 用 于 控制 线 
程 的 执行 和 数据 的 访问 。 


11.1.3 ”多 进程 和 多 线程 


很 多 同学 都 听 说 过 ， 现 代 操 作 系 统 ， 比 如 Mac OS 义 、UNIX、Linux、Windows 等 ， 都 是 
支持 “多 任务 ”的 操作 系统 。 

什么 叫 “ 多 任务 ” 呢 ? 简单 地 说 ， 就 是 操作 系统 可 以 同时 运行 多 个 任务 。 打 个 比方 ， 一 边 
用 浏览 器 上 网 ， 一 边 听 MP3， 一 边 用 Word 赶 作 业 ， 这 就 是 多 任务 ， 至 少 同时 有 3 个 任务 正在 
运行 。 还 有 很 多 任务 悄悄 地 在 后 台 同 时 运行 ， 只 是 桌面 上 没有 显示 而 已 。 

现在 ， 多 核 CPU 已 经 非常 普及 ， 但 是 ， 即 使 过 去 的 单 核 CPU， 也 可 以 执行 多 任务 。 由 于 
CPU 执行 代码 时 都 是 顺序 执行 的 ， 单 核 CPU 怎么 执行 多 任务 呢 ? 

答案 就 是 操作 系统 轮流 让 各 个 任务 交替 执行 ， 任 务 1 执行 0.01 秒 ， 切 换 到 任务 2， 任务 2 
执行 0.01 秒 ， 再 切换 到 任务 3， 执行 0.01 秒 …… 这 样 反 复 执行 下 去 。 表 面 上 看 ， 每 个 任务 都 是 
交 蔡 执行 的 ， 但 是 ， 由 于 CPU 的 执行 速度 实在 太 快 了 ， 我 们 感觉 就 像 所 有 任务 都 在 同时 执行 
一 样 。 

真正 的 并 行 执行 多 任务 只 能 在 多 核 CPU 上 实现 ， 但 是 ， 由 于 任务 数量 远 远 多 于 CPU 的 核 
心 数量 ， 因 此 操作 系统 会 自动 把 很 多 任务 轮流 调度 到 每 个 核心 上 执行 。 

对 于 操作 系统 来 说 ， 任 务 就 是 进程 ， 比 如 打开 一 个 浏览 器 就 启动 一 个 浏览 器 进程 ， 打 开 一 
个 记事 本 就 启动 了 一 个 记事 本 进程 , 打开 两 个 记事 本 就 启动 了 两 个 记事 本 进程 , 打开 一 个 Word 
就 启动 了 一 个 Word 进程 。 

有 些 进程 还 不 止 同时 干 一 件 事 ， 比 如 Word， 可 以 同时 进行 打字 、 拼 写 检查 、 打 印 等 事情 。 
在 进程 内 部 ,要 同时 干 多 件 事 , 就 需要 同时 运行 多 个 “ 子 任务 ”我 们 把 进程 内 的 这 些 “ 子 任务 ” 
称 为 线程 。 
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由 于 每 个 进程 至 少 要 干 一 件 事 ， 因 此 ， 一 个 进程 至 少 有 一 个 线程 。 当 然 ， 像 Word 这 种 复 
杂 的 进程 可 以 有 多 个 线程 ， 多 个 线程 可 以 同时 执行 ， 多 线程 的 执行 方式 和 多 进程 是 一 样 的 ， 也 
由 操作 系统 在 多 个 线程 之 间 快 速 切 换 ， 让 每 个 线程 都 短暂 地 交替 运行 ， 看 起 来 就 像 同 时 执行 一 
样 。 当 然 ， 真 正 地 同时 执行 多 线程 需要 多 核 CPU 才 可 能 实现 。 

前 面 编写 的 所 有 Python 程序 ， 都 是 执行 单 任务 的 进程 ， 也 就 是 只 有 一 个 线程 。 如 果 要 同时 
执行 多 个 任务 ， 怎 么 办 ? 通常 有 两 种 解决 方案 ， 一 种 是 启动 多 个 进程 ， 每 个 进程 虽然 只 有 一 个 
线程 ， 但 多 个 进程 可 以 一 块 执 行 多 个 任务 ， 另 一 种 是 启动 一 个 进程 ， 在 一 个 进程 内 启动 多 个 线 
程 ， 这 样 ， 多 个 线程 也 可 以 一 块 执行 多 个 任务 。 

还 有 第 三 种 解决 方案 ， 就 是 启动 多 个 进程 ， 每 个 进程 再 启动 多 个 线程 ， 这 样 同时 执行 的 任 
务 就 更 多 了 ， 当 然 这 种 模型 更 复杂 ， 实 际 很 少 采用 。 

总 而 言 之 ， 多 任务 的 实现 有 3 种 方式 ， 多 进程 模式 、 多 线程 模式 、 多 进程 + 多 线程 模式 。 


有 时 ， 任 务 1 必须 暂停 ， 等 竺 任务 2 完成 后 才能 继续 执行 ， 有时， 任务 3 和 任务 4 又 不 能 同时 
执行 。 所 以 ， 使 用 多 进程 和 多 线程 的 程序 的 复杂 度 要 远 远 高 于 前 面 写 的 使 用 单 进程 和 单线 程 的 
程序 。 

由 以 上 介绍 可 知 ， 线 程 是 最 小 的 执行 单元 ， 而 进程 由 至 少 一 个 线程 组 成 。 如 何 调度 进程 和 
线程 ， 完 全 由 操作 系统 决定 ， 程 序 目 己 不 能 决定 什么 时 候 执行 以 及 执行 多 长 时 间 。 

使 用 多 进程 和 多 线程 的 程序 涉及 同步 、 数 据 共享 的 问题 ， 编 写 起 来 更 复杂 。Python 既 文 持 
多 进程 ， 义 文 持 多 线程 。 


使 用 线程 


如 何 使 用 线程 ,线程 中 有 哪些 比较 值得 学 习 的 模块 呢 ? 本 节 将 对 线程 的 使 用 做 概念 性 讲解 ， 
稍 后 再 给 出 一 些 具 体 示例 以 供 参考 。 


11.2.1 全 局 解释 器 锁 


Python 代码 的 执行 由 Python 虚拟 机 (解释 器 主 循环 ) 控 制 。Python 在 设计 之 初 就 考虑 到 在 主 
循环 中 只 能 有 一 个 线程 执行 ， 虽 然 Python 解释 器 中 可 以 “运行 ”多 个 线程 ， 但 是 在 任意 时 刻 只 
有 一 个 线程 在 Python 解释 器 中 运行 。 

Python 虚拟 机 的 访问 由 全 局 解释 器 锁 (GID) 控 制 ， 这 个 锁 能 保证 同一 时 刻 只 有 一 个 线程 运行 。 

在 多 线程 环境 中 ，Python 虚拟 机 按 以 下 方式 执行 : 

(1) 讽 站 GIL。 

(2) 切换 到 一 个 线程 并 运行 。 

(3) 运行 指定 数量 的 字 节 码 指令 或 线程 主动 让 出 控制 (可 以 调用 time.sleep(0))。 

(4) 把 线程 设置 为 睡眠 状态 。 

(GS) 和 解 饼 GIL。 

(6) 再 次 重复 以 上 所 有 步骤 。 

在 调用 外 部 代码 (如 C/C++ 扩展 函数 ) 时 ，GIL 将 被 锁定 。 直 到 这 个 函数 结束 为 止 (由 于 在 此 
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期 间 没 有 运行 Python 的 字 节 码 ， 因 此 不 会 做 线程 切换 )， 编 写 扩展 函数 的 程序 员 可 以 主动 解锁 
GIL。 


11.2.2 ”退出 线程 


当 一 个 线程 结束 计算 后 ， 它 就 退出 了 。 线程 可 以 调用 thread.exit0 等 退出 函数 ， 也 可 以 使 用 
Python 退出 进程 的 标准 方法 (如 调用 sys.exitO 或 抛 出 SystemExit 异常 ， 不 过 不 可 以 直接 “ 杀 掉 ” 
(kilD 线 程 。 

不 建议 使 用 thread 模块 。 很 明显 的 一 个 原因 是 ， 当 主线 程 退 出 时 ， 其 他 线程 没有 清除 就 会 
退出 。 另 一 个 模块 Threading 能 确保 所 有 “重要 的 ” 子 线程 都 退出 后 ， 进 程 才 会 结束 。 


11.2.3 “Python 的 线程 模块 


Python 提供 了 几 个 用 于 多 线程 编程 的 模块 ， 包 括 thread、threading 和 Queue 等 。 thread 
和 threading 模块 允许 程序 员 创 建 和 管理 线程 。thread 模块 提供 对 基本 线程 和 锁 的 支持 ,threading 
模块 提供 更 高 级 别 、 功 能 更 强 的 线程 管理 功能 。Queue 模块 允许 用 户 创建 可 以 用 于 多 个 线程 之 
间 共 享 数据 的 队列 数据 结构 。 

请 避免 使 用 thread 模块 ,原因 有 3 个 。 痛 先 ， 更 高 级 别 的 threading 模块 更 为 先进 ， 对 线程 
的 文 持 更 完善 ， 而 且 使 用 thread 模块 里 的 属性 时 可 能 与 threading 模块 发 生 冲 突 ; 其 次 ， 低 级别 
的 _thread 模块 的 同步 原 语 很 少 (实际 上 只 有 一 个 )， 而 threading 模块 有 很 多 ; 最 后 ， 在 主线 程 结 
束 时 ，_thread 模块 中 的 所 有 线程 都 会 被 强制 结束 ， 既 没有 警告 ， 也 不 会 有 正常 的 清除 工作 ， 至 
少 threading 模块 能 确保 在 重要 子 线程 退出 后 进程 才 退 出 。 


_thread 模块 


start_ new_threadO0 函 数 是 _thread 模块 的 一 个 关键 图 数 。 在 Python 中 ， 可 调用 thread 模块 中 
的 start new_ thread0 国 数 以 产生 新 线程 。 语 法 如 下 : 


_thread.start new thread(function.ares|.kwares|) 


其 中 ，finction 为 线程 函数 ，args 为 传递 给 线程 函数 的 参数 ， 必 须 是 元 组 类 型 ，kwargs 为 
可 选 参数 。 

_thread 模块 除了 产生 线程 外 ， 还 提供 锁 对 象 dock object， 也 叫 原 语 锁 、 简 单 锁 、 互 斥 锁 、 
互 斥 量 、 二 值 信 和 号 量 )。 同 步 原 语 与 线程 管理 是 密 不 可 分 的 。 

_thread 模块 中 常用 的 线程 模块 函数 如 表 11-1 所 示 。 


表 11-1 _thread 模块 中 常用 的 线程 模块 函数 
start new_thread(fimction, args | 产生 一 个 新 的 线程 , 在 新 的 线程 中 用 指定 的 参数 和 可 选 的 kwargs 来 调用 该 
kwargs=None) 图 数 
allocate lockO 分 配 一 个 LockType 类 型 锁 对 象 
exXit) 让 线程 退出 


244 


第 11 草 多 线程 编程 


其 中 ，LockType 类 型 锁 对 象 的 第 用 方法 如 表 11-2 所 示 。 


表 11-2 LockType 类 型 锁 对 象 的 常用 方法 


方法 摘 述 
acquire(wait=None 兰 试 获取 锁 对 象 
lockedO) 如 果 获 取 了 锁 对 象 ， 返 回 True， 否 则 返回 False 
release() 释放 锁 


_thread 模块 的 示例 程序 如 下 : 


#1/usr/bm/python 
# -*-codine:UTF-8-*- 


import thread 
from tme 1mport sleep 
from datetime import datettme 


date time format—=%%y-%oM-%od YH:%oM:YoS' 


def date tme str(date time): 
return datetime.strfume(date time,date time format) 


def loop oneQ): 
print(+++ 线 程 一 开始 于 : ',date time str(datetime.now0)) 
print(+++ 线 程 一 休 虐 4 秒 ') 
sleep(4) 
print(++ 线 程 一 休眠 结束 ， 结 束 于 : ',date time str(datetime.now0)) 


det loop twol): 
print(*** 线 程 二 开始 于 : ',date time str(datetimenowO)) 
print(*** 线 程 二 休眠 2 秒 ) 
sleep(?) 
print(*** 线 程 二 休眠 结束 ， 结 束 于 : ',date_time str(datetime nowO)) 


def main(): 
prnt(-- 一 所 有 线程 开始 时 间 : ',date time str(datetime.now0)) 
_thread.start new thread(loop one.()) 
_thread.start new_thread(loop_ two.O) 
sleep(6) 
print(----- 甩 有 线程 结束 时 间 ; ',date_time str(datetime.now0)) 


站 name 一 main '# name 是 所 有 模块 的 内 建 属性 


mam() 


执行 以 上 程序 ， 输 出 结果 如 下 : 
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----- 所 有 线程 开始 时 间 : 18-44-30 21:44:09 
++H+ 线 程 一 开始 于 : *** 线 程 二 开始 于 : 18-44-30 21:44:0918-44-30 21:44:09 


+++ 线 程 一 休眠 4 秒 *** 线 程 二 休眠 2 种 


*#*#* 线 程 二 休眠 结束 ， 结 束 于 : 18-44-30 21:44:11 
+++ 线 程 一 休眠 结束 ， 结 束 于 : 18-44-30 21:44:13 
一 -一 所 有 线程 结束 时 间 : 18-44-30 21:44:15 


_thread 模块 提供 了 简单 的 多 线程 机 制 ， 两 个 循环 并 发 执行 ， 总 的 运行 时 间 为 最 慢 那 个 线程 
的 运行 时 间 ， 即 6 秒 钟 ， 而 不 是 所 有 线程 的 运行 时 间 之 和 。start_ new thread0 要 求 至 少 传 入 两 个 
参数 ， 即 使 想 要 运行 的 函数 个 需要 参数 ， 也 要 传 入 一 个 空 的 元 组 。 

sleep(6) 人 负责 让 主线 程 停 下 来 。 主 线程 一 旦 运行 结束 ， 就 关闭 运行 的 其 他 两 个 线程 。 这 可 能 
造成 主线 程 过 早 或 过 晚 退出 , 这 时 就 要 使 用 线程 锁 , 主线 程 可 在 两 个 子 线程 都 退出 后 立即 退出 。 
示例 程序 如 下 : 

import thread 

from time Import sleep 

import datetime 


loops=[4.2| 


def date time strO): 
Tetum datetime.datetime.now().strfume( YY-%m-%od YoH:%oNM:%08") 


def loop(n loop.n sec,lock): 
print( 线 程 (.n loop.) 开 始 执 行 : ,date time str0. 先 休眠 (mn_ sec,"”) 秒 ") 


sleep(n sec) 
print( 线 程 (,n_loop,") 休 卢 结束 ， 结 束 于 : ',date_time_str0) 
lock release() 
def mam'(): 
print(.…. 所 有 线程 开始 执行 …) 
locks=—|[| 


n loops-range(len(loops)) 
for1mn loops: 

lock= thread.allocate lock() 

lock.acquire() 

locks.append(lock) 
for1mn loops: 

_thread .start new thread(loop.(1,loops[1|.locks[1))) 
for1mn loops: 

while locks[il.locked(): 

pass 


print(... 所 有 线程 执行 结束 : ,date_ time str0) 
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i name — Imam ~ 
mam() 
执行 以 上 程序 ， 输 出 结果 如 下 : 
... 所 有 线程 开始 执行 .… 
线程 (线程 (01) 开 始 执行 ，) 开 始 执行 : 2018-12-30 21:49:322018-12-30 21:49:32. 先 休眠 (. 先 休 眼 (4 ) 秒 2) 秒 
线程 (1) 休 眠 结束 ， 结 束 于 : 2018-12-30 21:49:35 
线程 0) 休眠 结 束 ， 结 束 于 : 2018-12-30 21:49:37 
... 所 有 线程 执行 结束 : 2018-12-30 21:49:38 


可 以 看 到 ， 以 上 程序 使 用 了 线程 锁 。 


threading 模块 


threading 模块 不 仅 提 供 了 Thread 类 ， 还 提供 了 各 种 非常 好 用 的 同步 机 制 。 表 11-3 所 示 为 
threading 模块 里 所 有 的 对 象 。 


表 11-3 threading 模块 里 所 有 的 对 象 


threading 模块 里 的 对 象 摘 述 

Thread 表示 执行 线程 的 对 象 

Lock 锁 原 语 对 象 ( 跟 thread 模块 里 的 锁 对 象 相 同 ) 

RLock 可 重 入 锁 对 象 。 使 单线 程 可 以 再 次 获得 已 经 获 得 的 锁 (递归 锁定 ) 

Condition 条 件 变 量 对 象 ， 能 让 一 个 线程 停 下 来 ， 等 待 其 他 线程 满足 某 个 “条 件 ”， 如 状 
态 或 值 的 改变 

Event 通用 的 条 件 变量 。 多 个 线程 可 以 等 待 某 个 时 间 的 发 生 ， 在 事件 发 生 后 ， 所 有 的 

Semaphore 为 等 待 锁 的 线程 提供 类 似 于 “等 候 室 ” 的 结构 

BoundedSemaphore 与 Semaphore 对 象 类 似 ， 只 是 不 允许 超过 初始 值 

Timer 与 Thread 对 象 类 似 ， 只 是 要 等 待 一段 时 间 后 才 开 始 运行 


11.4.1 ”守护 线程 


_thread 模块 需要 避免 使 用 的 一 个 原因 是 : 它 不 文 持 守 护 线程 。 当 主线 程 退 出 时 ， 所 有 的 子 
线程 不 论 是 否 还 在 工作 ， 都 会 被 强行 退出 。 有 了 时 我 们 并 不 期 望 这 种 行为 ， 这 就 引入 了 守护 线程 
的 概念 。 

threading 模块 支持 守护 线程 ， 工 作 流 程 如 下 : 守护 线程 一 般 是 等 待 客户 请 求 的 服务 器 ， 如 
果 没 有 客户 提出 请 求 ， 它 就 在 那里 等 着 。 如 果 设 定 一 个 线程 为 守护 线程 ， 就 表示 这 个 线程 不 重 
要 ， 在 进程 退出 时 ， 不 用 等 待 这 个 线程 退出 ， 正 如 网 络 编程 中 服务 器 线程 运行 在 无 限 循环 中 ， 
一 般 是 不 会 退出 的 。 

主线 程 要 退出 的 时 候 ， 不 用 等 待 那些 子 线程 完成 ,但 需要 设 定 这 些 子 线程 的 daemon 标志 。 
换言之 ， 线 程 开始 (调用 thread.start0) 之 前 ， 如 果 调 用 setDaemon0 函 数 来 设 定 线 程 的 daemon 标 


志 (thread.setDaemon(True))， 就 表示 这 个 线程 “不 重要 ”。 

如 果 想 要 等 待 子 线程 完成 再 退出 ， 那 就 什么 都 不 用 人 做， 或 者 显 式 地 调用 
thread.setDaemon(False) 以 保证 其 daemon 标志 为 False。 可 以 调用 thread.isDaemon0 函 数 来 判断 
daemon 标志 的 值 。 

新 的 子 线程 会 继承 父 线程 的 daemon 标志 ， 整 个 Python 在 所 有 的 非 守 护 线程 退出 后 才 会 结 
束 ， 也 融 是 进程 中 没有 非 守 护 线程 存在 的 时 候 才 结束 。 


11.4.2 Thread 对 象 


threading 模块 的 Thread 对 象 是 主要 的 运行 对 象 ， 它 有 很 多 thread 模块 里 没有 的 函数 ， 这 些 
函数 如 表 11-4 所 示 。 


表 11-4 Thread 对象 提供 的 函数 


start() 开始 执行 线程 

runO 定义 线程 的 功能 (一 般 会 被 子 类 重 写 ) 

join(timeout=None) 程序 被 挂 起 ， 直 到 线程 结束 ; 如 果 指 定 了 timeout， 则 最 多 阻塞 用 timeout 指定 
的 秒 数 

setName() 返回 线程 名 称 

setName(name) 设置 线程 名 称 

isAlive0 布尔 标志 ， 表 示 线 程 是 否 还 在 运行 中 

isDaemon( 返回 线程 的 daemon 标志 

setDaemon(daemonic 把 线程 的 daemon 标志 设 为 daemonic( 一 定 要 在 调用 start0 函 数 前 调用 ) 


借助 Thread 对 象 ， 可 以 用 多 种 方法 创建 线程 。 现 在 介绍 3 种 方法 (通常 选择 最 后 一 种 ): 
(1) 创建 一 个 Thread 对 象 ， 传 给 它 一 个 函数 。 

(2) 创建 一 个 Thread 对 象 ， 传 给 它 一 个 可 调用 的 类 对 象 。 

(3) 从 Thread 关 派 生 一 个 子 类 ， 创 建 该 子 类 的 一 个 实例 。 

下 面 分 别 介 绍 这 几 种 方法 。 


1. 创建 一 个 Thread 对 象 ， 传 给 它 一 个 函数 


这 种 方法 把 函数 及 其 参数 像 11.3 节 的 例子 那样 传 进去 ， 主要 变化 包括 : 添加 了 一 些 Thread 
对 象 ， 在 实例 化 每 个 Thread 对 象 时 ， 把 函数 (targeb 和 参数 (args) 都 传 进 去 ， 得 到 返回 的 Thread 

实例 化 一 个 Thread 对 象 后 调用 threading.Thread0 方 法 , 与 调用 thread.start new thread0 之 间 
的 最 大 区 别 是 : 新 的 线程 不 会 立即 开始 。 当 创建 了 线程 ， 但 不 想 马 上 开始 运行 线程 的 时 候 ， 这 
是 一 个 很 有 用 的 同步 特性 。 

threading 模块 的 Thread 类 有 一 个 join0 函 数 ， 人 允许 主线 程 等 待 其 他 线程 结束 。 示 例 程序 
如 下 : 


#codme—utf-8 
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from time Import sleep, ctime 


loops = [4.2] # 睡 虐 时 间 


det loop(nloop, nsec): 
prnt( 开 始 循环 ,nloop. ' 开 始 时 间 :', ctime0) 
sleep(nsec) 
print( 循 环 ', nloop, ' 完 成 时 间 : '", ctime0) 


def main(): 
print( 开 始 时 间 于 : ', ctime0) 
threads = [] 
nloops = range(len(loops)) # 列 表 [0.1] 


# 创 建 线程 

for 1 1n nloops: 
t= threading. Thread(target=loop,ares=(i.loops[i])) 
threads.append(t) 


# 开 始 线程 : 所 有 的 线程 都 创建 之 后 ， 再 一 起 调用 start0 函 数 来 局 动 线程 
for 1 mn nloops: 
threads[1].start() 


# 等 待 所 有 结束 线程 
for 1 mn nloops: 
threads[1].jom() 


print( 所 有 线程 结束 时 间 :'. ctime0) 


i name 一 ”Imamn “: 
mam() 


执行 以 上 程序 ， 输 出 结果 如 下 : 
开始 时 间 于 : Sun Dec 30 22:36:04 2018 
开始 循环 开始 循环 01 开始 时 间 : 开始 时 间 : Sun Dec 30 22:36:04 2018 Sun Dec 30 22:36:04 2018 


循环 1 完成 时 间 :， Sun Dec 30 22:36:06 2018 
循环 0 完成 时 间 : Sun Dec 30 22:36:08 2018 
所 有 线程 结束 时 间 : Sun Dec 30 22:36:08 2018 


运行 结果 中 ， 循 环 0 和 循环 1 并 行 执行 ， 循 环 1 先 结束 ， 共 执行 2 秒 ， 循 环 0 后 结束 ， 执 


行 4 秒 ， 总 共 运行 4 秒 。 
所 有 线程 都 创建 之 后 ， 再 一 起 调用 start0 函 数 来 启动 线程 ， 而 不 是 创建 一 个 就 启动 一 个 。 


而 且 ， 不 用 再 管理 一 堆 锁 (分 配 锁 、 获 得 锁 、 释 放 锁 、 检 查 锁 的 状态 等 )， 只 要 简单 地 对 每 个 线 


= 
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程 调用 join0 函 数 就 可 以 了 。 

join0 会 等 到 线程 结束 ， 或 者 在 指定 了 timeout 参数 时 ， 等 到 超时 为 止 。 使 用 join0 比 使 用 等 
待 锁 释放 的 无 限 循环 更 清楚 一 些 ( 也 称 “ 自 旋 锁 ”)。 

join0 的 男 一 种 比较 重要 的 用 法 是 可 以 完全 不 用 调用 。 一 旦 线程 启动 后 ， 就 会 一 直 运 行 ， 直 
到 线程 所 在 的 函数 结束 ， 退 出 为 止 。 

如 果 主 线程 除了 等 线程 结束 外 ， 还 有 其 他 事情 要 做 (如 处 理 或 等 待 其 他 的 客户 请 求 )， 那 就 
不 用 调用 join0， 仅 在 青 要 等 待 线程 结束 的 时 候 才 调用 join0。 


2. 创建 一 个 Thread 对 象 ， 传 给 它 一 个 可 调用 的 类 对 象 


与 前 面 传 一 个 函数 的 方法 相似 ， 但 这 种 方法 传 一 个 可 调用 的 类 对 象 供 线程 司 动 时 执行 ， 这 
是 多 线程 编程 的 一 种 更 为 面 问 对 象 的 方法 。 相 对 于 一 个 或 几 个 函数 来 访 ， 由 于 类 对 象 里 可 以 使 
用 类 的 功能 ， 因 此 可 以 保存 更 多 的 信息 ， 这 种 方法 更 为 灵活 。 

示例 程序 如 下 : 

#codime—utf-8 

Import threadng 

Import pandas 

from tme 1mport sleep, ctime 


loops = [4.2| 
class ThreadFunc(object): 
def 1mt (seltfunc.,ares.nameQ=—"): 


self name—name 
self func=flmne 


selt.ares=args 


def call (self): 


self.func(*self.args) 
def loop(nloop.nsec): 
print ("开始 循环 ",nloop,' 循 环 时 间 : ',ctime0) 
sleep(nsec) 


print( 循 环 ',nloop,' 完 成 时 间 : ',ctime0) 


def maim(): 
print( 开 始 时 间 于 : ',ctime0) 
threads=[] 
nloops = range(len(loops)) 


for 1 mn nloops: 
# 调 用 ThreadFunc 的 实例 化 对 象 ， 创 建 所 有 线程 
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t= threadme.Thread( 
target=ThreadFunc(loop.,(i.loops[i]),loop. name ) 
threads.append(t) 


# 开 始 线程 
torllinmloops: 
threads[1|.start() 


# 等 得 有 所 有 结束 线程 
tor 1 mn nloops: 
threads[1].Jom0Q) 


print( 所 有 线程 结束 时 间 :', ctimeO) 


i name 一 ” mam “ 
Iaml) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
开始 时 间 于 ，Sun Dec 30 23:02:52 2018 
开始 循环 开始 循环 01 循环 时 间 :， 循环 时 间 :，Sun Dec 30 23:02:52 2018 Sun Dec 30 23:02:52 2018 


循环 1 完成 时 间 : Sun Dec 30 23:02:54 2018 
循环 0 完成 时 间 :， Sun Dec 30 23:02:56 2018 
所 有 线程 结束 时 间 : Sun Dec 30 23:02:56 2018 


以 上 程序 中 ,传递 的 是 一 个 可 调用 的 类 ， 而 不 是 一 个 函数 。 创 建 Thread 对 象 时 会 实例 化 一 
个 可 调用 类 ThreadFunc 的 类 对 象 。 这 个 类 保存 了 函数 的 参数 、 函 数 本 身 以 及 函数 的 名 字 字 符 串 。 

构造 函数 ”init 0 用 于 初始 化 赋值 工作 。 

对 于 特殊 函数 call 0Q， 由 于 已 经 有 要 使 用 的 参数 ， 因 此 不 用 再 传 给 Thread0 构 造 函 数 。 

3. 从 Thread 类 派生 一 个 子 类 ,创建 该 子 类 的 一 个 实例 

这 种 方法 的 关键 在 于 如 何 子 类 化 Thread 类 , 与 前 面 的 第 二 种 方法 类 似 。 其 中 ,创建 子 类 方 
法 和 调用 类 对 象 方法 的 最 重要 改变 是 : 

(1) MyThread 子 类 的 构造 函数 一 定 要 先 调 用 基 类 的 构造 函数 。 

(2) 之 前 的 特殊 函数 ”call 0 在 子 类 中 ， 名 字 要 改 为 nm0。 


示例 程序 如 下 : 

import threading 

from time import sleep, ctime 

loops = [4.2] # 睡 眠 时 间 
class MyThread(threading. Thread): 


def mt (selt func, args, name="): 


-i 


threadme.Thread. 1mt (self) 
self.name—name 
self.func=func 

selt.ares=args 


def rn(self): un0 羡 数 
selft.func(*self.args) 


def loop(nloop., nsec): 
print(" 开 始 循环 ", nloop, "循环 时 间 :', ctimeO) 
sleep(nsec) 
print( 循 环 ', nloop, ' 完 成 时 间 :', ctime0) 


ee 
print( 开 始 时 间 于 ;', ctime0) 
re 
nloops range(len(loops)) ”# 列 表 [0.1] 


tor 1 mn nloops: 
# 将 子 类 MyThread 实例 化 ， 创 建 所 有 线程 
t=MyThread(loop. (loops[i]). loop. name  ) 
threads.append(t) 


# 开 始 线 程 
for 1 mn nloops: 
threads[1|.start() 


# 等 竺 所 有 结束 线程 
for 1 mn nloops: 
threads[i].jomO 


print( 所 有 线程 完成 时 间 :', ctime0) 


i name 一 ” mam “: 
Ialn() 
执行 以 上 程序 ， 输 出 结果 如 下 : 
开始 时 间 于 : Sun Dec 30 23:14:43 2018 
开始 循环 开始 循环 01 循环 时 间 ; 循环 时 间 : Sun Dec 30 23:14:43 2018Sun Dec 30 23:14:43 2018 


循环 1 完成 时 间 : Sun Dec 30 23:14:46 2018 
循环 0 完成 时 间 : Sun Dec 30 23:14:48 2018 
所 有 线程 完成 时 间 : Sun Dec 30 23:14:48 2018 


除了 各 种 同步 对 象 和 线程 对 象 外 ，threading 模块 还 提供 了 一 些 函 数 ， 如 表 11-5 所 示 。 
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表 11-5 threading 模块 提供 的 其 他 函数 


activeCount() 当前 活动 的 线程 对 象 的 数量 
currentThreadO 返回 当前 线程 对 象 

enumerate() 返回 当前 活动 线程 的 列表 
settrace(func) 为 所 有 线程 设置 一 个 跟踪 函数 
setprofile(fime) 为 所 有 线程 设置 一 个 配置 消 数 


线程 同步 


如 果 多 个 线程 共同 对 菜 个 数据 进行 修改 ， 则 可 能 出 现 不 可 预料 的 结果 ， 为 了 保证 数据 的 正 
确 性 ， 需 要 对 多 个 线程 进行 同步 。 

使 用 Lock 和 Rlock 对 象 可 以 实现 简单 的 线程 同步 ， 这 两 个 对 象 都 有 acquire0 和 release0 方 
法 , 对 于 那些 需要 每 次 只 允许 一 个 线程 操作 的 数据 , 可 以 操作 放 到 acquire0 和 release0 方 法 之 间 。 

多 线程 的 优势 在 于 可 以 同时 运行 多 个 任务 (至 少 感 觉 是 这 样 )。 但 是 当 线 程 需要 共享 数据 时 ， 
可 能 存在 数据 不 同步 的 问题 。 

考虑 这 样 一 种 情况 : 一 个 列表 里 所 有 元 和 素 都 是 0， 线程 set 从 后 同 前 把 有 所有 元 系 改 成 1， 而 
线程 print 负责 从 前 往 后 读 取 列表 并 打印 。 那 么 ， 可 能 线程 set 刚 开 始 改 的 时 候 ， 线 程 print 便 打 
印 列表 了 ， 输 出 就 成 了 一 半 0、 一 半 1， 这 束 导 致 数据 的 不 同步 。 为 了 避免 这 种 情况 ， 引 入 了 锁 
的 概念 。 

锁 有 两 种 状态 一 一 锁定 和 未 锁定 。 每 当 一 个 线程 (比如 seb 要 访问 共享 数据 时 ， 必 须 先 获得 
锁定 ; 如 果 已 有 别 的 线程 (比如 prinb 获 得 锁定 了 ， 那 么 就 让 线程 set 芹 停 ， 也 就 是 同步 阻塞 ; 等 
到 线程 print 访问 完毕 ， 释 放 锁 以 后 ， 再 让 线程 set 继续 。 

经 过 这 样 的 处 理 ， 打 印 列表 时 要 么 全 部 输出 0， 要 么 全 部 输出 1， 不 会 再 出 现 一 半 0、 一 半 
] 的 尴 众 场面 。 

示例 程序 如 下 : 


#codime—utf-8 
#1/usr/bim/python 


1mport threadme 
Import time 
class my Thread (threadme..Thread): 
def mt (self threadID, name, counter): 
threadmg.Ihread. Inlit (self) 
selt.threadID =threadID 


self name = name 
self counter = counter 


| 


def run(self): 
print(" 开 始 "+selfname) 
# 获得 锁 ， 成 功 获 得 锁定 后 返回 True 
# 可 选 的 timeout 参数 不 填 时 将 一 直 阻 塞 直到 获得 锁定 
# 否则 超时 后 将 返回 False 
threadLock.acquire() 
print time(self.name. self.counter, 3) 
# 释放 锁 
threadLock release() 


def prnt time(threadName., delay, counter): 
while counter: 
time.sleep(delay) 
print("%os: %os" % (threadName. time.ctime(time.time()))) 
counter -= ] 


threadLock = threadmne.Lock() 
threads = [] 


# 创建 新 线程 
threadl = myThread(1, "Thread-1", 1) 
thread2 = myThread(2, "Thread-2", 2) 


# 开局 新 线程 


thread1.start(O) 
thread2.start() 


# 添加 线程 到 线程 列表 
threads.append(thread1) 
threads.append(thread2) 


# 等 待 所 有 线程 完成 
for t m threads: 

tjoin0) 
print(" 退 出 主线 程 ") 


执行 以 上 程序 ， 输 出 结果 如 下 : 


开始 Thread-1 开始 Thread-2 


Thread-1: Sun Dec 30 23:24:26 2018 
Thread-1: Sun Dec 30 23:24:27 2018 
Thread-1: Sun Dec 30 23:24:28 2018 
Thread-2: Sun Dec 30 23:24:31 2018 
Thread-2: Sun Dec 30 23:24:33 2018 
Thread-2: Sun Dec 30 23:24:35 2018 
退出 主线 程 
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由 执行 结果 可 以 看 到 ， 程 序 的 执行 得 到 了 正确 的 同步 。 


Queue 模块 


Queue 模块 可 以 用 来 进行 线程 间 的 通信 ， 让 各 线程 之 间 共 享 数据 。 

Python 的 Queue 模块 提供 了 同步 、 线 程 安全 的 队列 类 ， 包 括 FIFO( 先 入 先 出 ) 队 列 Queue、 
LIFO( 后 入 先 出 ) 队 列 LifoQueue 和 优先 级 队列 PriorityQueue。 这 些 队 列 都 实现 了 锁 原 语 ， 能 够 
在 多 线程 中 直接 使 用 。 可 以 使 用 队列 实现 线程 间 的 同步 。 

Queue 模块 中 的 第 用 方法 如 表 11-6 所 示 。 


表 11-6 ”Queue 模块 中 的 常用 方法 


方法 描述 
queue.qsize( 返回 队列 的 大 小 
queue.empty( 如 果 队 列 为 空 ， 返 回 Tme， 否 则 返回 False 
queue.fullO 如 果 队 列 满 了 ， 返 回 Tme， 否 则 返回 False 
queue.get([block[, timeout]]) | 获取 队列 ，timeout 为 等 待 时 间 
queue.get nowait() 相当 于 queue.get(False) 
queue.put(item) 写 入 队列 ，timeout 为 等 待 时 间 
queue.put nowait(item) 相当 于 queue.put(item, False) 
queue.task done() 在 完成 一 项 工作 之 后 ，queue.task_done0 方 法 同 任 务 已 经 完成 的 队列 发 送 一 个 

信号 

Jueue.joing) 实际 上 意味 看 等 到 队列 为 空 再 执行 别 的 操作 


单 癌 队列 的 示例 程序 如 下 : 
import queue 


q=queue.Queue(5) 。 ”# 如 果 不 设置 长 度 ， 默 认为 无 限 长 
print(q.maxsize) 礁 主 意 里 面 没有 圆 括 号 

q.put(123) 

q.put(456) 

q.put(789) 

q.put(100) 

q.put(111) 

q.put(233) 

prnt(q.getO) 

print(q.getO) 


打印 时 会 阻塞 ， 为 什么 呢 ? 因为 创建 了 5 个 元 素 长 度 的 队列 ， 但 放 进 去 6 个 元 素 ， 所 以 就 
阻 竖 了 。 如 果 少 写 一 个 元 率 ， 就 能 显示 出 正确 的 123。 
后 进 先 出 队列 的 示例 程序 如 下 : 


q = queue.LifoQueue() 
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q.put(12) 
q.put(34) 
print(q.getO) 


优先 级 队列 的 示例 程序 如 下 : 


q = queue.PrniontyQueued) 
q-.put((3.'aaaaa')) 

q.put((3.bbbbb")) 

q.put((1,'cecee')) 

q-put((3,'ddddd')) 

print(q.getO) 

print(q.getO) 

执行 以 上 程序 ， 输 出 结果 如 下 : 


(1, 'ccccc ) 
(3. aaaaa ) 


双 问 队列 的 示例 程序 如 下 : 


qdq=queue.dequeW 

q.append(123) 

q.append(436) 

q.appendleft(780) 

print(q.popO) 

print(q.popleft)) 

执行 以 上 程序 ， 输 出 结果 如 下 : 


426 
780 


线程 与 进程 的 比较 


多 进程 和 多 线程 是 实现 多 任务 最 利用 的 两 种 方式 。 下 面 通过 线程 切换 、 计 算 密集 情况 和 异 
步 IO 三 方面 来 讨论 这 两 种 方式 的 优 缺 点 。 

首先 ， 要 实现 多 任务 ， 通 常会 设计 Master-Worker 模式 ，Master 负责 分 配 任务 ，Worker 负 
责 执 行 任务 。 因 此 ， 在 多 任务 环境 下 ， 通 第 是 一 个 Master、 多 个 Worker。 

如 果 用 多 进程 实现 Master-Worker 模式 ， 主 进程 就 是 Master， 其 他 进程 就 是 Worker。 

如 果 使 用 多 线程 实现 Master-Worker 模式 ， 主 线程 就 是 Master， 其 他 线程 就 是 Worker。 

多 进程 模式 最 大 的 优点 就 是 稳定 性 高 ， 因 为 一 个 子 进程 朋 尝 了 ， 不 会 影响 主 进 程 和 其 他 子 
进程 。 当 然 ， 主 进程 挂 了 所 有 进程 也 就 全 挂 了 , 但 是 Master 进程 只 负责 分 配 任务 , 挂 的 概率 低 。 
著名 的 Apache 最 早 就 是 采用 多 进程 模式 。 

多 进程 模式 的 缺点 是 创建 进程 的 代价 大 ， 在 UNIX/Linux 系统 下 ， 使 用 forkQ 调 用 还 行 ， 在 
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Windows 下 创建 进程 的 开销 巨大 。 另 外 ， 操 作 系 统 能 同时 运行 的 进程 数 也 是 有 限 的 ， 在 内 存 和 
CPU 的 限制 下 ， 如 果 有 几 千 个 进程 同时 运行 ， 操 作 系 统 连 调度 都 会 成 问题 。 

多 线程 模式 通常 比 多 进程 模式 快 一 点 ， 但 是 也 快 不 到 哪里 去 ， 而 且 ， 多 线程 模式 致命 的 缺 
点 就 是 任何 一 个 线程 挂 掉 都 可 能 直接 造成 整个 进程 朋 尝 ， 因 为 所 有 线程 共享 进程 的 内 存 。 在 
Windows 系统 下 ， 如 果 一 个 线程 执行 的 代码 出 了 问题 ， 经 常 可 以 看 到 这 样 的 提示 : “该 程序 执 
行 了 非法 操作 , 即将 关闭 ”, 其 实 往往 是 某 个 线程 出 了 问题 , 但 是 操作 系统 会 强制 结束 整个 进程 。 


11.7.1 ”线程 切换 


无 论 是 多 进程 还 是 多 线程 ， 数 量 太 多 ， 效 率 肯定 会 降低 。 

打 个 比方 ， 你 正在 准备 中 考 ， 每 天 晚上 需要 做 语文 、 数 学 、 英 语 、 物 理 和 化 学 5 科 作 业 ， 
每 科 作 业 耗 时 1 小 时 。 

如 果 先 花 1 小 时 做 语文 作业 ， 接 着 花 1 小 时 做 数学 作业 ， 这 样 依次 全 部 做 完 ， 一 共 花 5 个 
小 时 ， 这 种 方式 称 为 单 任务 模型 或 批 处 理 任 务 模型 。 

如 果 打 算 切 换 到 多 任务 模型 ， 可 以 先 做 1 分 钟 语文 作业 ， 切 换 到 数学 作业 做 1 分 钟 ， 再 切 
换 到 英语 作业 做 1 分 钟 ， 依 此 类 推 ， 只 要 切换 速度 足够 快 ， 这 种 方式 就 和 单 核 CPU 执行 多 任务 
一 了。 

不 过 切换 作业 是 有 代价 的 ， 比 如 从 语文 切换 到 数学 ， 要 先 收拾 果子 上 的 语文 课本 和 钢笔 ( 保 
存 现场 )， 然 后 打开 数学 课本 ， 找 出 圆规 、 尺 子 (准备 新 环境 )， 才 能 开始 做 数学 作业 。 操 作 系统 
在 切换 进程 或 线程 时 也 一 样 ， 需 要 先 保存 当前 执行 的 现场 环境 (CPU 寄存 器 状态 、 内 存 页 等 )， 
然后 把 新 任务 的 执行 环境 准备 好 (恢复 上 次 CUP 寄存 器 状态 、 切 换 内 存 页 等 )， 才 能 开始 执行 。 
这 个 切换 过 程 虽 然 很 快 ， 但 是 也 需要 耗费 时 间 。 如 果 有 几 和 王 个 任务 同时 进行 ， 操 作 系 统 可 能 
要 性 着 切换 任务 ， 根 本 没有 多 少时 间 执 行 任务 。 这 种 情况 最 常见 的 就 是 硬盘 狂 响 ， 单 击 窗口 无 
反应 ， 系 统 处 于 假死 状态 。 

所 以 ， 多 任务 一 旦 达到 某 个 限度 ， 就 会 消耗 系统 所 有 资源 ， 导 致 效率 急剧 下 降 ， 所 有 任务 
都 做 不 好 。 


11.7.2 ”计算 密集 型 与 IO 密集 型 


是 否 采用 多 任务 的 另 一 考虑 是 任务 的 类 型 。 我 们 可 以 把 任务 分 为 计算 密集 型 和 IO 密集 型 
任务 两 种 。 

计算 密集 型 任务 的 特点 是 要 进行 大 量 的 计算 ， 消耗 CPU 资源 ， 比 如 计算 圆周 率 、 对 视频 进 
行 高 清 解 码 ， 等 等 ， 全 靠 CPU 的 运算 能 力 。 这 种 计算 密集 型 任务 虽然 也 可 以 用 多 任务 完成 , 但 
是 任务 越 多 ， 花 在 任务 切换 上 的 时 间 就 越 多 ，CPU 执行 任务 的 效率 就 越 低 。 所 以 ， 要 最 高 效 地 
利用 CPU， 计 算 密集 型 任务 同时 进行 的 数量 应 当 等 于 CPU 的 核心 数 。 

计算 密集 型 任务 由 于 主要 消耗 CPU 资源 ， 因 此 代码 运行 效率 至 关 重 要 。Python 这 样 的 脚 
本 语言 运行 效率 很 低 ,， 完全 不 适合 计算 密集 型 任务 。 对 于 计算 密集 型 任务 , 最 好 用 C 语言 编写 。 

涉及 网 络 、 磁 盘 IO 的 任务 都 是 IO 密集 型 任务 ， 这 类 任务 的 特点 是 CPU 消耗 很 少 ， 任 务 
的 大 部 分 时 间 都 在 等 待 IO 操作 完成 (因为 IO 的 速度 远 远 低 于 CPU 和 内 存 的 速度 )。 对 于 IO 密 
集 型 任务 ， 任 务 越 多 ，CPU 效率 越 高 ， 但 也 有 限度 。 和 常见 的 大 部 分 任务 都 是 IO 密集 型 任务 ， 
比如 Web 应 用 。 


sr 


IO 密集 型 任务 执行 期 间 ，99% 的 时 间 都 花 在 IO 上 ， 花 在 CPU 上 的 时 间 很 少 。 因 此 ， 用 运 
行 速度 极 快 的 C 语言 替换 Python 这 样 运行 速度 极 低 的 脚本 语言 ， 完 全 无 法 提升 运行 效率 。 对 
于 IO 密集 型 任务 ， 最 合适 的 语言 就 是 开发 效率 最 高 (代码 量 最 少 ) 的 语言 ， 脚 本 语言 是 首选 ，C 


语言 最 差 。 
1 了 3 呈 朱 只 


考虑 到 CPU 和 IO 之 间 巨 大 的 速度 差异 , 一 个 任务 在 执行 的 过 程 中 大 部 分 时 间 都 在 等 待 IO 
操作 ， 单 进程 或 单线 程 模型 会 导致 别 的 任务 无 法 并 行 执行 ， 因 此 ， 我 们 才 需 要 多 进程 或 多 线程 
模型 来 支持 多 任务 并 发 执行 。 

现代 操作 系统 对 IO 操作 已 经 做 了 巨大 改进 ， 最 大 的 特点 就 是 支持 异步 IO。 如 果 能 充分 利 
用 操作 系统 提供 的 异步 IO 支持 ， 就 可 以 用 单 进程 或 单线 程 模型 来 执行 多 任务 ， 这 种 全 新 的 模 
型 被 称 为 事件 驱动 模型 ，Nginx 就 是 支持 异步 IO 的 Web 服务 器 ， 它 在 单 核 CPU 上 采用 单 进程 
模型 就 可 以 高 效 地 支持 多 任务 。 在 多 核 CPU 上 ， 可 以 运行 多 个 进程 (数量 与 CPU 核心 数 相同 )， 
充分 利用 多 核 CPU。 由 于 系统 总 的 进程 数量 十 分 有 限 ， 因 此 操作 系统 调度 非常 高 效 。 用 异步 IO 
编程 模型 来 实现 多 任务 是 主要 的 趋势 。 


本 章 实战 


本 节 将 通过 一 些 稍微 复杂 的 应 用 实例 ， 介 绍 Python 中 常用 的 多 线程 编程 技术 。 
11.8.1 ” 斐 波 孝 契 数列 、 阶 乘 和 加 和 


下 面 主 要 通过 多 线程 的 方式 来 演示 如 何 求 斐 波 那 契 数列 、 阶 乘 和 加 和 。 首 先 声 明 
threading.Thread 的 子 类 MyThread, 在 MyThread 类 中 加 入 输出 信息 , 除了 使 用 apply0 函 数 运行 
斐 波 那 契 数列 、 阶 乘 和 加 和 国 数 外 ， 还 把 结果 保存 到 selfres 属性 中 ， 并 创建 函数 getResultO 以 
得 到 结果 。 程 序 如 下 : 

ee 


1mport threadineg 
from time Inport sleep, ctime 


class MyThread(threadme.Thread): 


def 1mt (selt, fmc, args, name—"): 
threading.Thread. init (self) 
seltname=name 
selt.fnc=func 
selt.ares=args 


def getResult(self): 
Tetum self.res 
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def rm(self): Un 函数 
print("Startine", self.name, at… cime()) 
selt.res = self.func(*self.args) 
print(self.name., "finished at cme()) 


将 以 上 程序 保存 为 myThread.py。 

然后 创建 threadfunc.py 文件 ， 调 用 前 面 定义 的 myThreadpy 中 的 MyThread 类 。 由 于 这 些 
函数 运行 得 很 快 ( 斐 波 那 契 数列 函数 运行 慢 些 )， 使 用 sleep0 函 数 比 较 它 们 的 时 间 。 实 际 工作 中 
不 需要 添加 sleep0 函 数 。 程 序 如 下 : 


#codme—utf{-8 
from myThread import MyThread ”#nyThread.py 文件 中 的 MyThread 类 
from time 1mport sleep, ctime 


# 非 波 那 契 数列 国 数 
def fib(x): 
sleep(0.005) 
2 
retum 1 
retum (fib(x-2) + fib(x-1)) 


# 阶 乘 函 数 
def fac(x): 
sleep(0.1) 
fx < 人 2: 
Tetum 1 
retum (x * fac(x-1)) 


# 加 和 函数 
def sum(x): 
sleep(0.1) 
于 天 二 
Tetum 1 
Tetum (xX + sum(x-1)) 


funcs = [fib, fac, sum | 
n= 14 


def mam’(): 
nfuncs = ranee(len(funcs)) 


print(****#+ 围 此 程 方法 +*##) 

for 1 mn nfunces: 
print(Startne’, fnmcs[lil. name .at ctimegO) 
print(fimcs[i](n)) 
print(Fimished', fncs[i]l. name :at ctime()) 
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print(****+ 结 束 单 线程 *****") 


print( ") 
pamt(*++##+ 多 线程 方法 +**+*+ 太 ) 
threads = [] 

for 11n nfiuncs: 


# 调 用 MyThread 类 的 实例 化 对 象 ， 创 建 所 有 线程 
t= MyThread(funcs[il, (n.), funcs[1]. name ) 
threads.append(t) 


# 开 始 线程 
for 1 1n nfines: 
threads|1].startO) 


# 等 待 所 有 结束 线程 

for 1 mn nfunes: 
threads[1|.Jom() 
print(threads[1|.getResult()) 


print(**+**+* 结 束 多 线程 *****") 


执行 以 上 程序 ， 输 出 结果 如 图 11-1 所 示 。 可 以 看 出 ， 单 线程 运行 10 秒 ， 多 线程 运行 6 秒 。 


2 CITC ee 


:\pyproject2pythons threadfune. py 
站 守明 线程 方法 夺 站 站 上 站 
sun Jan 13 23:14:04 2019 


t: Sun Jan 13 23:14:11 2019 
ts: Sun Jan 13 23°:14:11 2019 


: SUNn Jan 13 23:14:13 2019 
: SUn Jan 13 294:14:13 2019 


inished sum at: Sun Jan 13 23:14:14 2019 
时 和 丰厚 和 下 吕 毕 怒 程 和 站 站 站 站 


和 让 和 生字 级 各 方法 半球 下 
: Sun Jan 13 23:14:14 2019 
: Sun Jan 13 23:14:;14 2019 
: Sun Jan 13 23:14:14 2019 
: SUn Jan 13 23:14:15 2019 
t: Sun Jan 13 23:14:15 2019 
: Sun Jan 13 23:14:21 2019 


S7178291200 


rr 结束 多 线程 were 
11-1 程序 运行 结果 


11.8.2 ”使 用 队列 解决 生产 者 /消费 者 模型 


Queue 模块 实现 了 多 生产 者 、 多 消费 者 的 队列 。 当 要 求 信 息 必 须 在 多 线程 间 安 全 交换 时 ， 
Queue 模块 在 进行 线程 编程 时 非常 有 用 .Queue 模块 实现 了 所 有 要 求 的 锁 机 制 .总 而 言 之 ,Queue 
模块 主要 是 多 线程 ， 可 保证 线程 的 安全 使 用 。 下 面 就 来 介绍 如 何 使 用 Queue 模块 解决 生产 者 / 
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消费 者 模型 。 

如 图 11-2 所 示 ， 可 以 发 现 生 产 者 和 消费 者 之 间 用 中 间 类 似 队 列 的 东西 串 起 来 。 可 将 队列 想 
象 成 存放 产品 的 “仓库 ”， 生 产 者 只 需要 关心 “仓库 ”， 并 不 需要 关心 具体 的 消费 者 ， 对 于 生 
产 者 而 言 甚 全 都 不 知道 这 些 消费 者 存在 。 对 于 消费 者 而 言 ， 他 们 也 不 需要 关心 具体 的 生产 者 以 
及 到 底 有 多 少 生 产 者 ， 而 只 关心 “仓库 ”中 还 有 没有 东西 。 这 和 是 一 种 松 硝 合 模型 。 这 样 可 以 回 
答 上 面 提出 的 第 一 个 问题 。 这 个 模型 的 产生 就 是 为 了 复 用 和 解 奔 ， 比 如 贡 见 的 消息 框架 (非常 经 
典 的 一 种 生产 痢 / 消 费 者 模型 的 使 用 场景 )ActiveMQ。 发 送 端 和 接收 端 用 Topic 进行 关联 。Topic 
可 以 理解 为 “仓库 ”的 地 址 ， 这 样 就 可 以 使 用 点 对 点 和 广播 两 种 方式 进行 消 恩 的 分 发 。 


图 11-2 生产 者 /消费 者 模型 
下 面 解决 程序 解 得 ， 以 较 少 的 资源 解决 高 并 发 问题 。 程 序 如 下 : 


queue.threading.time 


qd-queue.Queue0 


def product(are): 


while True: 


q.put(str(arg)+" 包 子 ") 


det consumer(are): 
while Tme: 
print(arg,q.getO) 
time.sleep(2) 


def mam(): 
for1 1m range(3): 
t=threading. Thread(target—product.args=(i,)) 
t.start( ) 
for ] In range(20): 
t=threadneg..Thread(target—consumer.ares={(].)) 
t.start( ) 
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i name 一 ” mam “: 


mam() 
可 以 执行 以 上 程序 ， 查 看 生产 者 /消费 者 模型 的 模拟 输出 。 
11.8.3” 子 进 程 的 使 用 


在 Python 中 , 可 以 通过 multiprocessing 模块 中 的 功能 来 模拟 子 进程 的 执行 。 在 使 用 的 时 候 ， 
需要 引入 该 模块 中 的 Process: 


from multiprocessing 1mport Process 
可 以 通过 Process 来 构造 子 进程 ， 语 法 格式 如 下 : 
p= Process(target=—fun,ares=(ares)) 


接着 通过 p.start0 来 启动 子 进 程 , 然后 通过 p.join0 使 得 子 进程 运行 结束 后 执行 父 进 程 。 示例 
程序 如 下 : 


from multiprocessing 1mport Process 
Inport os 


# 子 进程 要 执行 的 代码 
def run proc(name): 
print(Run child process %s (9%0s).. % (name. os.getp1d())) 


i name — mam “ 
print( Parent process %os.' 2%0 0s.getp1id()) 
p= Process(target=run proc. args=('test.)) 
pnnt( Process will start ) 
pstartU 
p:jomO 
pnnt( Process end.") 
执行 以 上 程序 ， 输 出 结果 如 下 : 
Parent process 16564. 
Process will start. 
Process end. 


11.8.4 ”进程 池 的 使 用 


如 果 需 要 多 个 子 进程 ， 可 以 考虑 使 用 进程 池 来 管理 。 进 程 池 可 以 提供 指定 数量 的 进程 供用 
户 调用 ， 当 有 新 的 请 求 提交 到 进程 中 时 ， 如 果 进 程 池 还 没有 满 ， 就 会 创建 一 个 新 的 进程 来 执行 
该 请 求 ;， 但 如 果 进 程 池 中 的 进程 数 已 经 达到 规定 的 最 大 值 ， 该 请 求 束 会 等 待 ， 直 到 进程 池 中 有 
进程 结束 ， 才 会 创建 新 的 进程 。 

要 使 用 进程 池 ， 需 要 引入 multiprocessing 模块 中 的 Pool: 
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from mmultiprocessing 1mport Pool 
创建 进程 池 的 语法 格式 如 下 : 
Pool([mumprocess [.initializer [. initargs]]) 


其 中 各 项 参数 的 含义 如 下 。 

e numprocess: 要 创建 的 进程 数 ， 如 果 省 略 ， 将 默认 使 用 CPU 核心 数 。 

e initializer: 每 个 工作 进程 启动 时 要 执行 的 可 调用 对 象 ， 默 认为 None。 

e initargs: 要 传 给 initializer 的 参数 组 。 

关于 进程 池 的 使 用 ， 有 以 下 常用 方法 。 

e pp.apply(func [, args [, kwargs]]): 在 一 个 池 工 作 进 程 中 执行 func(*args,**kwargs)， 然 后 返 
回 结果 。 需 要 强调 的 是 : 此 操作 不 会 在 所 有 池 工 作 进 程 中 执行 fancO 畏 数 。 如 果 要 通过 
不 同 参 数 并 发 地 执行 func0 函数 ， 就 必须 从 不 同 线程 调用 p.apply0 或 者 使 用 
p.apply async()。 

e pp.apply async(func [, args [, kwargs]: 在 一 个 池 工 作 进 程 中 执行 func(*args,**kwargs)， 
然后 返回 结果 。 返 回 结果 是 AsyncResult 类 的 实例 。 

e pclose0: 关闭 进程 池 ， 防 止 进一步 操作 。 如 果 所 有 操作 持续 挂 起 ， 它 们 将 在 池 工 作 进 
程 终止 前 完 

e p.jon0: 等 待 所 有 池 工 作 进 程 退 出 ， 只 能 在 close0 或 terminate0 之 后 调用 。 

通过 p.apply0 使 用 进程 池 的 示例 程序 如 下 : 


from mmultiprocessing 1mport Pool 
1mport os,time 
def work(n): 
print(%s TUD %o0s.getpid()) 
time.sleep(3) 
retumn n**2 


i name —' mam “: 
p=PoolG) # 在 进程 池 中 从 无 到 有 创建 三 个 进程 ， 以 后 一 直 是 这 三 个 进程 在 执行 任务 
res 二 |] 
tor1in range(10): 
Tes=p.apply(workargs=(i))# 同 步 运行 ， 阻 塞 ， 直 到 本 次 任务 执行 完毕 拿 到 Tes 
res |.append(res) 
print(res 了 


通过 p. apply_async0 使 用 进程 池 的 示例 程序 如 下 : 


from mmultiprocessing 1mport Pool 
Import os, time 


def lone time task(name): 


print(Run task %s (%08)...' % (name., os.getpid())) 
start = time.time() 
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time.sleep(3) 
end = time.time() 
print(Task %%s runs %00.2f seconds.’ % (name. (end - start))) 


i name — mam “: 
print(Parent process %s.' %0 0s.getp1id()) 
p= Pool() 
for 1 mn ranege($): 
Pp.apply_async(long time task args=(1,)) 
print(Waitine for all subprocesses done.') 
p.close() 
pjJomO 
print( All subprocesses done.") 
执行 上 面 的 程序 ， 输 出 结果 如 下 : 


Parent process 4996. 
Wailting for all subprocesses done. 
All subprocesses done. 


使 用 Pool 创建 子 进程 的 方法 与 前 面 的 Process 不 同 ， 是 通过 p.apply async(func,ares=(ares)) 
实现 的 ， 进 程 池 中 能 同时 运行 的 任务 数量 取决 于 计算 机 的 CPU 核心 数 ， 如 果 计 算 机 中 有 4 个 
CPU， 那 子 进程 task0、taskl 、task2 、task3 可 以 同时 启动 ，task4 则 在 之 前 的 某 个 子 进程 结束 后 
才 开 始 。 

代码 中 的 p.close0 用 于 关闭 进程 池 , 不 再 回 里 面 添 加 进程 ,对 Pool 对 象 调用 join0 会 等 待 所 
有 子 进程 执行 完毕 , 调用 join0 之 前 必须 先 调用 close0， 调 用 close0 之 后 就 不 能 继续 添加 新 的 进 
程 了 。 

在 上 面 的 程序 中 , 也 可 以 在 实例 化 Pool 的 时 候 定 义 子 进程 数 ,如果 上 面 代 人 码 中 的 p=Pool(5)， 
那么 所 有 的 子 进程 就 可 以 同时 进行 。 


11.8.5 ”多 个 子 进程 则 的 通信 


进程 之 间 是 需要 通信 的 ， 操 作 系 统 提 供 了 很 多 机 制 来 实现 进程 间 的 通信 。Python 的 
multiprocessing 模块 包装 了 底层 的 机 制 ， 提 供 Queue、Pipes 等 多 种 方式 来 交换 数据 。 

这 里 以 Queue 为 例 , 在 父 进程 中 创建 两 个 子 进程 , 一 个 往 Queue 中 写 数 据 , 男 一 个 从 Queue 
中 读数 据 。 示 例 程序 如 下 : 


from multiprocessing Import Process, Queue 
1mport os, time, random 


# 写 数据 进程 执行 的 代码 
def write(q): 
print(Process to wnte: %os' % 0s.getpid()) 
for value m [A', 'B', 'C'|: 
print(Put %s to queue.… % value) 
q-.put(value) 
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time.sleep(random .random()) 


# 读数 据 进程 执行 的 代码 
def read(q): 
prmt( Process to read: %s' % os.getpid()) 
whle True: 
value = q.get(True) 
print(Get %s from queue % value) 


i name — mam “ 
# 父 进程 创建 Queue， 并 传 给 各 个 子 进程 
qd=Queueg 
pw = Process(tareet—w1lte, ares—(g.)) 
pr = Process(target-read, args=(q.)) 
# 启动 子 进 程 pw， 写 入 : 
pw.startO 
# 局 动 子 进程 pr， 读 取 
pr-startO 
# 等 待 pw 结束 
pWw.Jom0 
#pr 进程 中 是 死 循 坏 ， 不 能 等 得 其 结束 ， 只 能 强行 终止 
pr.termimate() 


执行 以 上 程序 ， 输 出 结果 如 下 : 


Process to WIite: $50563 
Put A to queue... 
Process to read: 50564 
Get A from queue. 

Put B to queue... 

Get B from queue. 

Put C to queue... 

Get C from queue. 


本 音 小 结 


默认 情况 下 ，Python 代码 都 是 在 单 进 程 或 单线 程 中 执行 的 。 当 CPU 空闲 时 ， 这 会 极 大 浪 
费 资源 ， 降 低 作 业 吞 吐 量 。Python 语言 提供 了 多 线程 处 理 机 制 。 多 线程 编程 技术 可 以 实现 代码 
并 行 ， 优 化 处 理 能 力 ， 同 时 可 以 将 代码 划分 为 功能 更 小 的 模块 ， 使 代码 的 可 重用 性 更 好 。 本 章 
首先 介绍 了 进程 和 线程 、 多 进程 和 多 线程 的 概念 。 接 着 介绍 了 在 Python 中 如 何 使 用 线程 。 然 后 
介绍 了 如 何 使 用 thread、threadmg、Queue 三 大 模块 处 理 线程 。 最 后 仔细 对 线程 和 进程 进行 了 
比较 。 通 过 本 章 的 学 习 ， 大 家 应 能 在 Python 编程 过 程 中 熟练 使 用 线程 技术 进行 多 任务 处 理 。 
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思考 与 练习 


1. 己 知 列表 info = [1,2,3,4,55,233]， 生 成 与 列表 中 元 素 个 数 相 同 的 线程 对 象 ， 每 个 线程 输 
出 一 个 值 ， 最 后 输出 "the end"。 

2. 已 知 列表 urlinfo = [http://www.sohu.com','http://www.163.com',http://www.sina.com'], 用 多 
线程 的 方式 实现 以 下 功能 : 

(1) 分 别 打 开 列 表 里 的 URL， 并 且 输 出 对 应 网 页 的 标题 和 内 容 。 

(2) 分 别 打开 列表 里 的 URL， 输 出 网 页 的 HITP 状态 码 。 

3. 使 用 多 线程 技术 测试 代码 的 执行 时 间 。 

4. 使 用 多 线程 技术 ， 从 线程 中 不 断 取 出 偶数 。 

5. 编程 实现 锁 的 添加 和 释放 。 

6. 编程 实现 以 下 功能 : 有 10 个 刷卡 机 ， 代 表 建 立 10 个 线程 ， 每 个 刷卡 机 每 次 扣除 用 户 一 
块 钱 ， 计 入 总 账 ， 每 个 刷卡 机 每 天 一 共 被 刷 100 次 。 账 户 中 原 有 500 块 钱 ， 所 以 当天 最 后 的 总 
账 应 该 为 1500 块 钱 。 

7. 建立 生成 右 对 象 ， 并 且 用 生成 占 对 象 的 next0 和 send0 方 法 输出 结果 。 

8. 计算 1 一 100 000 之 间 所 有 素数 的 和 ， 要 求 如 下 : 

e 编写 函数 来 判断 一 个 数字 是 否 为 素数 。 

e 使 用 内 置 函 数 sum0 统 计 所 有 系数 的 和 。 
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几乎 所 有 的 大 规模 商业 系统 都 使 用 数据 库 来 存储 数据 。 例 如 ， 在 线 零 售 商 Amazon 就 需要 
用 数据 库 来 存储 销售 的 每 件 产 品 的 信息 。Python 要 想 证 明 自 己 能 够 处 理 这 类 企业 级 应 用 程序 ， 
就 必须 能 够 访问 和 操纵 数据 库 。 

六 运 的 是 ，Python 提供 了 一 套数 据 库 API( 实 现 数据 库 编 程 的 方法 )， 这 是 一 套 通 用 API， 使 
开发 人 员 可 以 访问 大 多 数 数 据 库 ， 而 不 必 考 虑 这 些 数据 库 本 里 的 那些 互 不 相同 的 本 地 API。 这 
些 数 据 库 的 API 并 没有 定义 使 用 数据 库 的 所 有 方面 ， 因 此 它们 存在 一 些 细微 的 差别 。 然 而 ,在 
大 多 数 情形 下 ， 可 以 从 Python 脚本 访问 一 些 数据 库 ， 例 如 Oracle 或 MySQL， 而 不 必 过 分 担心 
特定 数据 库 的 细节 。 

拥有 一 套 通用 的 数据 库 API 是 非 音 有 用 的 ， 在 需要 切换 数据 库 或 者 让 应 用 程序 使 用 多 种 数 
据 库 ， 同 时 又 不 希望 对 代码 的 主要 部 分 进行 修改 时 特别 有 用 。Python 对 数据 库 开 发 方面 的 支持 
可 以 完全 胜任 这 一 工作 。 

即使 不 是 在 编写 网 站 ， 数 据 库 也 提供 了 一 种 便捷 的 方法 ， 使 数据 的 存在 时 间 比 正在 运行 的 
程序 更 久 ( 这 样 ， 如 果 希 望 重 新 启动 程序 ， 那 么 用 户 已 经 输入 的 数据 将 不 会 丢失 )， 并 且 使 查询 
数据 和 以 一 种 安全 的 方式 修改 数据 变 得 更 简单 。 

本 章 将 介绍 Python 支持 的 两 个 主要 数据 库 系 统 : dbm 持久 字典 和 使 用 DB API 的 关系 数据 
库 。 男 外 ， 本 章 还 将 描述 如 何 安 装 数据 库 。 


本 章 的 学 习 目标 : 
e 就 练 使 用 dbm 库 创 建 持久 字典 。 


e 了 解 关 系数 据 库 的 概念 ， 掌 握 SQLite 和 MySQL 的 安装 。 

e 使 用 Python 的 DB API。 

e 掌握 访问 数据 库 的 相关 操作 ， 包 括 创建 数据 库 连 接 、 使 用 游标 访问 数据 、 查 询 及 修改 
数据 等 。 


。 了 解 事务 操作 和 错误 处 理 。 
e 了解 其 他 数据 库 工具 的 使 用 。 


在 很 多 情况 下 ， 由 于 应 用 需求 比较 简单 ， 并 不 需要 成 熟 的 关系 数据 库 。 在 这 种 情况 下 ， 使 
用 dbm 创建 持久 字典 就 足够 了 。 

持久 字典 的 行为 正如 开发 人 员 预 期 的 一 样 ， 可 以 用 来 存储 键 / 值 对 。 它 们 被 保存 在 磁盘 上 ， 
因此 在 程序 的 多 次 运行 中 ， 它 们 的 数据 得 以 保持 。 如 果 将 数据 存储 到 dbm 文 持 的 字典 中 ， 那 么 
当下 一 次 局 动 程 序 时 ， 一 旦 加 载 dbm 文件， 就 可 以 再 次 读 取 存储 于 指定 键 下 的 值 。 这 些 字典 和 
标准 的 Python 字典 对 象 非常 类 似 ,主要 的 区 别 在 于 数据 是 在 磁盘 上 写 入 和 读 取 的 ， 男 一 个 不 同 
之 处 是 键 和 值 都 必须 是 字符 串 类 型 。 

dbm 是 database manager 的 缩写 , 是 原来 在 UNIX 系统 中 创建 的 许多 C 语言 库 的 通用 名 称 。 
这 些 库 的 名 称 有 dbm、gdbm、ndbm、sdbm 等 。 这 些 名 称 与 Python 中 己 有 的 、 可 提供 必要 功能 
的 模块 密切 对 应 。 


12.1.1 选择 dbm 模块 


Python 支持 很 多 dbm 模块 。 每 个 dbm 模块 都 文 持 相似 的 接口 ， 并 使 用 一 个 特定 的 C 语 
言 库 问 磁 盘存 储 数 据 ， 主 要 的 差别 在 于 磁盘 上 各 个 数据 文件 的 奔 层 二 进 制 格式 。 遗 憾 的 是 ， 
每 个 dbm 模块 创建 的 文件 是 不 兼容 的 。 也 就 是 说 ， 如 果 使 用 某 个 dbm 模块 创建 dbm 持久 字 
典 ， 那 么 必须 使 用 相同 的 模块 来 读 取 数据 。 其 他 任何 模块 都 不 能 处 理 该 数据 文件 。 表 12-1 所 
示 的 是 这 些 dbm 模块 。 


表 12-1 dbm 模块 
模块 说 明 
dbm 选择 最 好 的 dbm 模块 
dbm.dumb 使 用 dbm 库 的 一 种 简单 但 可 移植 的 实现 
dbm.enu 使 用 GNU dbm 库 


由 于 dbm 库 的 历史 原因 ， 产 生 了 这 些 dbm 模块 。 起 初 ，dbm 库 只 在 商用 版 本 的 UNIX 上 
提供 。UNIX 免费 版 和 之 后 的 Linux、Windows 等 系统 都 不 能 使 用 dbm 库 。 这 导致 各 种 替代 库 
的 产生 ， 例 如 Berkeley UNIX 库 和 GNU dbm 库 。 

由 于 这 些 文件 格式 不 兼容 ， 过 多 的 库 非 常 令 人 痛 苗 。 然 而 ，dbm 模块 是 一 种 方便 的 选择 ， 可 
以 避免 目 己 选择 特定 的 dbm 模块 。 可 以 让 dbm 模块 普 目 己 做 出 选择 。 一 般 而 言 ， 在 创建 新 的 持 
入 字典 时 ，dbm 模块 将 选择 系统 上 已 有 的 、 最 好 的 实现 方式 。 当 读 取 文件 时 ，dbm 模块 会 使 用 
whichdb0 函 数 针对 哪个 库 创建 了 数据 文件 做 出 有 根据 的 猜测 。 


12.1.2 创建 持久 字典 


所 有 的 dbm 模块 都 支持 使 用 open0 函 数 创建 新 的 dbm 对 象 。 一 旦 成 功 打开 , 便 可 以 在 字典 
中 存储 数据 、 读 取 数 据 、 关 闭 dbm 对 象 (以 及 相关 联 的 数据 文件 )、 移 除 项 、 检 查 字 典 中 是 否 
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在 某 个 键 ， 等 等 。 
如 果 要 打开 dbm 持久 字典 ,可 使 用 所 选择 模块 的 open0 函 数 。 例如， 可 以 使 用 dbm 模块 创 
建 持久 字典 ， 输 入 如 下 代码 ， 并 将 文件 命名 为 dbmereate .py: 


db = dbm.open( websites','c’') 


db['www.baidu.com'] = baidu home page' 
print(db['www.baidu.com']) 

# 关 闭 并 保存 到 磁盘 上 

db.close() 

执行 以 上 程序 ， 输 出 结果 如 下 : 
baidu home page’ 


这 个 示例 中 使 用 了 dbm 模块 。 其 中 ，open0 函 数 需 要 字典 的 名 称 以 创建 新 的 字典 。 这 个 名 
称 被 转换 为 可 能 已 经 存在 于 磁盘 上 的 数据 文件 的 名 称 (dbm 模块 可 能 创建 两 个 文件 , 通 音 一 个 文 
件 用 于 数据 ， 男 一 个 文件 用 于 键 的 索引 )。 字典 的 名 称 被 视 为 基本 的 、 包 括 路 径 的 文件 名 称 。 通 
弟 ， 底 层 的 dbm 库 将 为 数据 附加 后 级 ， 如 .dat。 可 以 通过 查找 以 websites 命名 的 文件 来 找到 此 
类 文件 ， 它 们 可 能 就 位 于 当前 的 工作 目录 中 。 

除了 关键 字 外 ， 还 需要 传递 可 用 标志 ， 表 12-2 所 示 的 是 open0 函 数 可 用 标志 。 


表 12-2 dbm 模块 中 open(O) 函 数 的 可 用 标志 


标志 用 法 


名 打开 文件 以 便 对 其 进行 读 写 ， 必 要 时 创建 该 文件 

] 打开 文件 以 便 对 其 进行 读 写 ,但 忆 是 创建 一 个 新 的 空 文 件 。 如 果 该 文件 已 经 存在 ， 
它 将 被 窗 盖 ， 已 有 的 内 容 将 会 丢失 

W 打开 文件 以 便 对 其 进行 读 写 ， 但 如 果 该 文件 不 存在 ， 那 么 不 会 创建 它 


dbm 模块 的 open0 函 数 会 返回 一 个 新 的 dbm 对 象 ， 可 以 使 用 该 对 象 存储 和 检索 数据 。 
打开 一 个 持久 字典 之 后 ， 可 以 像 写 入 普通 的 Python 字典 那样 写 入 值 ， 例 如 ; 
db["www.baidu.com'| = baidu home page' 


键 和 值 都 必须 是 字符 串 ， 而 不 能 是 其 他 对 象 ， 比 如 数值 或 Python 对 象 。 然 而 ， 如 果 想 保存 
一 个 对 象 ， 可 以 使 用 pickle 模块 对 它 进行 序列 化 。 

上 述 示例 的 最 后 一 行 执行 close0 以 关闭 文件 ， 并 将 数据 保存 到 磁盘 上 。 
12.1.3 ”访问 持久 字典 


使 用 dbm 模块 时 ， 可 以 将 open0 函 数 返回 的 对 象 视 作 字典 对 象 ， 通 过 如 下 语法 形式 实现 值 
的 获取 和 芭 首 : 
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db['key’ | = walue’ 
value = db['key] 


可 以 使 用 del 删除 字典 中 的 值 ， 语 法 如 下 : 


del db[Aey| 

keys0 方 法 会 返回 包含 所 有 和 键 的 一 个 列表 ， 方 式 与 处 理 标准 字典 时 相同 ， 语 法 格式 如 下 : 
tor key Im db .keysO): 

# do somethme... 


注意 : 


如 果 文 件 中 包含 大 量 的 键 ， 那 么 keyskeys0 方 法 的 执行 可 能 会 占用 很 长 时 间 。 另 外 ， 对 于 


较 大 的 文件 ，keys0 方 法 可 能 需要 大 量 的 内 存 来 存储 为 这 些 文件 创建 的 较 大 列表 ， 


下 面 的 示例 展示 了 如 何 使 用 dbm 持久 字典 进行 编程 : 
import dbm 


db = dbm.open( websites',Ww’) 
# 添 加 男 一 个 字典 
db["www.loneledme.com'| = "loneledne home page’ 


# 验 证 前 一 个 字典 是 否 还 在 
if db[ www.baidu com | != None: 
print( 发 现 字 典 www.baidu.com') 
else: 
printCwww.baidu.coom 不 存在 ) 


# 调 历 字典 对 象 
for key m db.keys(): 
pnnt( 天 ey = ",key," value = ",db[key]) 


del db[www.longleding.com ] 
print(" 删 除 www.longleding.com 之 后 的 字典 ") 


for key Im db.keys(): 
print("Key 一 了 ey,” value ee "db[key]) 


# 关闭 并 保存 到 磁盘 上 

db.close() 

将 以 上 程序 保存 为 dbmaccess.py。 执 行 以 上 程序 ， 输 出 结果 如 下 : 
发 现 字 典 www.baidu.com 


Key=b'www.baidu.com value=b'baidu home page' 
Key=b'www.loneledmeg.com' vwalue =b'longledme home page' 
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删除 www-.longleding.com 之 后 的 字典 : 

Key=bwww.baidu.com value=b'baidu home page’ 

以 上 程序 处 理 一 个 包含 一 些 网 站 的 URL 及 其 描述 的 小 型 数据 库 。 首 先 要 运行 前 面 的 
dbmcereate.py 程序 。 该 例 创建 了 dbm 文件 ， 并 在 dbm 文件 中 存储 数据 。dbmaccess.py 程序 随后 
会 打开 已 经 存在 的 dbm 文件 。 

dbmaccess.py 以 读 / 写 模式 打开 持久 字典 websites。 如 果 磁 盘 上 的 当前 目录 中 没有 包含 必要 
的 数据 文件 ， 那 么 对 open0 函 数 的 调用 将 产生 错误 。 

在 dbmcreatepy 中 ， 字 典 中 会 有 一 个 值 ， 以 www.baidu.com 为 键 。 本 例 添 加 网 站 
www.longleding.com 作为 另 一 个 键 。 

该 程序 使 用 如 下 代码 验证 键 www.baidu.com 是 否 存在 于 字典 中 : 


十 由 | www.baltducom | != None: 
print( 发 现 字 典 www.baidu.comy) 
else: 
printCwww.baidu.coom 不 存在 ") 


然后 打印 出 字典 中 的 所 有 键 与 值 : 


for key m db.keys(): 
print("Key = ",key." value = ",db[key]) 


从 输出 结果 可 以 发 现 ， 此 时 字典 中 只 包含 两 个 条 目 。 
在 打印 出 所 有 条 目 之 后 ， 使 用 del 删除 其 中 一 个 条 目 : 


del db['www.longleding.com!] 


然后 再 次 打印 出 所 有 的 键 与 值 ， 字典 中 只 包含 一 个 条 目 。 

最 后 ， 使 用 close0 关 闭 这 个 字典 ， 将 对 字典 的 所 有 修改 保存 到 磁盘 上 。 因 此 ， 在 下 次 打开 
此 文件 时 ， 它 将 处 于 关闭 它 Ae 

可 以 看 到 ， 处 理 持久 字典 的 API 极其 简单 ， 因 为 它 的 工作 原理 与 文件 和 字典 非常 类 似 。 


12.1.4 dbm 与 关系 数据 库 的 适用 场合 


当 实 际 项 目 中 需要 存储 一 些 键 / 值 对 时 ，dbm 模块 十 分 有 用 。 如 果 要 在 键 / 值 对 中 存储 更 复 
杂 的 数据 ， 例 如 ， 对 于 字典 中 的 键 和 值 部 分 ， 通 过 创建 格式 化 的 字符 串 ， 使 用 逗号 或 其 他 字符 
来 划 定 字 符 串 中 各 项 的 边界 , 可 能 非常 难以 维护 , 并 且 因为 数据 是 以 一 种 不 灵活 的 方式 存储 的 ， 
所 以 处 理 起 来 会 受到 诸多 限制 。 另 一 种 限制 是 : 一 些 dbm 库 对 可 以 用 于 值 的 空间 总 数 进行 了 限 
制 (有 时 达到 最 大 值 1024 字 节 ， 但 这 仍 显得 非常 小 )。 

因此 ， 对 于 数据 存储 的 选 型 ， 可 以 参照 以 下 原则 : 

e 如 果 数 据 需求 很 简单 ， 使 用 dbm 持久 字典 。 
如 果 计 划 只 存储 少量 的 数据 ， 使 用 dbm 持久 字典 。 
如 果 需 要 文 持 事务 ， 那 么 使 用 关系 数据 库 。 
如 果 需 要 一 些 复杂 的 数据 结构 或 多 个 用 于 连接 数据 的 表 ， 那 么 使 用 关系 数据 库 。 
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e 如 果 需 要 与 一 个 已 有 的 系统 协作 ， 那 么 显然 使 用 该 系统 。 这 个 系统 是 关系 数据 库 的 可 
能 性 很 大 。 
相对 于 dbm 模块 的 简洁 来 说 ， 关 系数 据 库 提供 了 更 加 丰富 而 复杂 的 API。 
其 实 还 有 男 一 种 数据 库 可 供 使 用 ， 虽 然 这 超出 了 本 章 的 讨论 范围 。 这 种 数据 库 是 ORM 或 对 
象 -关系 数据 库 ， 它 允许 数据 在 不 与 天 系数 据 库 兼容 的 各 个 类 型 系统 间 相 互 转换 。 
如 果 和 希望 使 用 ORM, Python 提供 了 几 种 选择 , 例如 SQL Object、SOLAlchemy 甚至 Django 
ORM。 


关系 数据 库 与 SQL 


天 系数 据 库 已 经 产生 几 十 年 了 ， 因 此 它们 是 一 种 非常 成 熟 和 知名 的 技术 。 关 系数 据 库 是 进 
行 复 杂 数 据 存储 时 的 首选 技术 。 

在 关系 数据 库 中 ， 数 据 存储 在 各 个 表 ( 义 称 数据 表 ， 可 人 简称“ 表 ”) 中 ， 表 可 以 看 作 二 维 数 
据 结 构 。 每 一 列 ， 或 者 说 二 维和 矩阵 中 垂直 的 部 分 ， 都 具有 相同 的 数据 类 型 ， 比 如 字符 串 、 数 值 、 
日 期 等 ， 这 些 列 又 称 为 字段 。 表 的 每 个 水 平 部 分 由 一 些 行 组 成 ， 这 些 行 也 称 为 记录 。 每 行 又 由 
列 组 成 。 通 第 ， 每 条 记录 保存 与 一 个 条 目 有 关 的 信息 ， 例 如 一 张 音 频 CD、 一 个 人 、 一 个 订单 、 
一 辆 汽车 等 。 

例如 ， 表 12-3 所 示 的 就 是 简单 的 雇员 表 。 


表 12-3 ”雇员 表 


103 Peter Tosh 595-53555 


201 555 5551 


座 员 表 包 含 6 列 :empid 为 雇员 JID 与 ,fstname 为 雇员 的 名 ,lastname 为 雇员 的 姓 ,department 
为 雇员 所 在 工作 部 门 的 卫 号 ，manager 为 部 门 经 理 的 雇员 ID 号 ，phone 为 办 公 电 话 号 码 。 

在 现实 生活 中 ， 一 家 公司 可 能 会 保存 关于 雇员 的 一 些 更 多 的 信息 ， 例 如 税务 机 关 识 别 号 码 
(在 美国 是 社会 安全 号 码 )、 家 庭 住址 等 ， 但 原理 上 没有 什么 区 别 。 

在 此 例 中 ，empid 是 雇员 卫 号 ， 用 作 主 键 。 主 键 是 表 的 唯一 索引 ， 其 中 每 个 元 素 必 须 是 唯 
一 的 ， 因 为 数据 库 可 能 使 用 那个 元 素 作 为 给 定 行 的 键 以 及 作为 引用 该 行 中 数据 的 方式 ， 这 是 一 
种 与 Python 字典 中 的 键 和 值 类 似 的 方式 。 因 此 ， 每 个 雇员 需要 有 唯一 的 ID 号 ， 而且 一 旦 有 了 
ID 号 ， 便 可 以 查找 任何 雇员 。 因 此 ，empid 将 作为 表 中 内 容 的 键 。 

department 列 保存 部 门 的 卫 号 , 这 是 男 一 个 表 中 一 行 的 了 号 。 因 为 这 个 ID 作为 另 一 个 表 
的 键 ， 所 以 可 以 将 这 个 ID 看 作 外 键 。 

例如 ， 表 12-4 所 示 的 是 部 门 表 的 可 能 布局 。 
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表 12-4 ”部 门 表 
departmentid manager 
1 Development 47 
2 QA 息 


在 大 公司 中 ， 数 据 库 中 可 能 有 数 百 个 表 ， 革 些 表 中 有 数 千 条 甚至 数 百 万 条 记录 。 
12.2.1 SQL 语言 


结构 化 查询 语言 (Structured Query Laneuage，SQL) 定 义 了 用 于 查询 和 修改 数据 库 的 一 种 标 
准 语言 。SQL 支持 如 表 12-5 所 示 的 基本 操作 。 


表 12-5 SQL 基本 操作 


操作 用 法 
Select 执行 一 个 得 询 ， 以 在 数据 库 中 搜索 指定 的 数据 
Update 修改 一 行 或 春 干 行 ， 通 利根 据 特定 的 条 件 进 行 修 改 
Insert 在 数据 库 中 创建 新 行 
Delete 从 数据 库 中 删除 行 


一 般 将 这 些 基 本 的 操作 称 为 QUID(Query、Update、Insert 和 Delete 的 缩写 ) 或 CRUD(Create、 
Read、Update 和 Delete 的 缩写 )。 虽 然 SQL 还 提供 了 其 他 操作 ， 但 这 些 操 作 使 用 最 多 。 

SQL 是 非常 重要 的 ， 因 为 当 使 用 Python 的 DB API 访问 数据 库 时 ， 必 须 先 创建 一 些 SQL 
语句 ， 才 能 通过 数据 库 对 它们 执行 这 些 语句 。 

CRUD 操作 的 基本 SQL 语法 如 下 : 

SELECT columns FROM tables WHERE condition ORDER BY colunms 

ascending or descending 

UPDATE table SET new values WHERE condition 

INSERT INTO table(columns)VALUES(values) 

DELETE FROM table condition 


除了 这 种 基本 写法 之 外 ， 每 个 操作 还 有 其 他 很 多 可 选 的 参数 和 说 明 符 。 如 果 熟 悉 SQL， 那 
么 仍然 可 以 通过 Python 的 DB API 使 用 它们 。 
以 前 面 的 雇员 表 为 例 ， 为 了 在 雇员 表 中 插入 新 行 ， 可 以 使 用 如 下 类 似 SQL 语句 : 


Insert mto employee(empid., frstname. lastname. manager. dept phone) 
values(3, ‘Bunny’, Wailer', 2. 2, '555-5553") 


在 此 例 中 ， 第 一 个 元 组 顺序 列 出 要 插入 的 数据 的 列 名 ( 即 字 段 名 ); 第 二 个 元 组 在 关键 字 
values 之 后 ， 给 出 第 一 个 元 组 中 对 应 列 名 的 值 列 表 。 注 意 ，SQL 使 用 单 引号 限定 字符 串 ， 数 值 
则 直接 书写 。 

对 于 查询 ,使 用 * 表 示 希 望 使 用 表 中 的 所 有 列 执行 某 个 操作 。 例如， 要 查询 部 门 表 中 的 所 有 
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行 ， 并 显示 每 行 的 所 有 列 ， 可 以 使 用 类 似 下 面 的 查询 语 苛 : 


select * from department 


注意 : 


SQL 对 关键 字 是 不 区 分 大 小 写 的 ， 例 如 SELECT 和 FROM.。 


上 述 SQL 语句 省 略 了 要 读 取 的 列 名 以 及 可 以 缩减 返回 的 数据 量 的 任何 条 件 。 因此 , 此 查询 
将 会 返回 所 有 的 列 (通过 *) 和 行 (因为 没有 where 子 句 )。 

对 于 select 命令 ， 可 以 通过 执行 连接 来 实现 从 多 个 表 中 查询 数据 ， 但 是 将 数据 显示 在 响应 
中 。 因 为 将 会 返回 来 自 两 个 表 的 数据 ， 就 仿佛 是 从 单个 表 中 查询 到 的 ， 所 以 称 为 连接 。 例 如 ， 
对 于 每 个 雇员 ， 要 提取 其 所 在 部 门 的 名 称 ， 可 以 执行 类 似 下 面 的 查询 语句 (作为 单一 查询 ， 此 语 
句 的 所 有 部 分 需要 包含 在 一 个 字符 串 中 ): 


select employee.firsthname. employee.lastname, department.name 

from employee. department 

where employee.dept= department.departmentid 

order by lastname desc 

在 此 例 中 ，select 语句 请 求 来 日 雇员 表 的 两 列 (firsthame 和 lastname 列 ， 但 是 按照 指定 表 中 
表 名 和 列 名 的 约定 ， 这 些 列 被 指定 为 来 日 于 雇员 表 ) 和 来 自 部 门 表 的 一 列 (department.name)。 语 
句 的 order by 部 分 向 数据 库 表 明 按照 lastmame 列 中 的 值 对 结果 集 进行 降序 排列 。 

为 了 简化 这 些 查 询 ， 可 以 使 用 表 的 别名 。 例 如 ， 要 使 用 e 作为 雇员 表 的 别名 ， 碍 询 语句 
如 下 : 


select e.firstname., e.lastname 
from employee e 


可 见 ， 在 from 子 句 部 分 ， 必 须 将 别名 e 放置 于 表 的 名 称 之 后 。 也 可 以 使 用 可 选 基 键 字 as 
并 采用 如 下 格式 ， 这 样 更 有 助 于 理解 : 


select e.firstname. e.lastname 
from employee ase 


使 用 如 下 SQL 语句 修改 (或 更 新 ) 一 行 : 

Update employee set manager=35 Where empid=3 

这 里 对 ID 为 3 的 雇员 进行 修改 ， 将 此 雇员 的 经 理 设置 为 ID 为 55 的 雇员 。 与 其 他 查询 一 
数值 的 周围 不 需要 有 引号 。 然 而 ， 字符 串 需要 放 在 单 引号 内 。 

使 用 如 下 SQL 语句 删除 一 行 : 


训 


delete employee where empid—42 
以 上 语句 会 删除 了 D 为 和 2 的 雇员 。 
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12.2.2 ”建立 数据 库 

在 大 多 数 情况 下 ， 开 发 人 员 都 有 已 启动 和 运行 的 数据 库 ， 或 是 所 在 机 构 提供 的 数据 库 。 例 
如 ， 如 果 在 提供 诸如 数据 库 等 附属 配件 的 网 站 托管 公司 托管 网 站 ， 托 管 程序 包 可 能 包括 对 
MySQL 数据 库 的 访问 。 如 果 受 雇 于 某 个 大 型 组 织 ， 那 么 IT 部 门 可 能 已 经 对 使 用 的 数据 库 进 行 
了 标准 化 ， 例 如 统一 采用 Oracle、DB2、Sybase 或 Informix 等 。 如 果 使 用 Python 创建 企业 级 应 
用 程序 ， 那 么 在 工作 区 中 后 面 的 这 些 程序 包 可 能 已 经 有 了 。 

如 果 还 没有 任何 数据 库 , 但 仍然 希望 继续 运行 本 章 的 示例 ， 那 么 使 用 SQLite 数据 库 将 是 不 
错 的 选择 。SQLite 的 主要 优点 是 随 Python 一 起 安装 ， 简 单 、 轻 便 、 实 用 。 

使 用 SQLite 创建 数据 库 是 非常 简单 的 。 例 如 ， 以 下 程序 创建 了 一 个 数据 库 : 


ImDbpofrt os 
Impoit sqlite3 
conn—sqlite3.connect('sample database') 
cursor—conn.cursor() 
# Create tables 
cursor.execute(™"™" 
create table employee 
(empid mteger, 
frstmame varchar. 
lastname varchar. 
dept mteger, 
manager mteger, 
phone varchar) 
Es ) 
cursor.execute(™™" 
create table department 
(departmentid mteger, 
name varchar. 
manager nteger) 
Sy 2 
CUTSOT.EXecUte( 
create table User 
(userid mteger, 
usermame varchar. 
employeeld mteger) 
2 3 
# Create mdices 
cursor.execute("""create mdex userid on user (userid)"™™") 
cursor.execute("""create ndex empid on employee (empid)"™"") 
cursor.execute("""create Index deptid on department (departmentid)"™™") 


cursor.execute("""create mdex deptfk on employee (dept)"™™") 
cursor.execute("""create mdex mer on employee (manager)"™™) 
cursor.execute("""create index emplid on user (employee1d)"™™") 


cursor.execute("""create mdex deptmer on department (manager)"™™) 


conn.commat() 
cursor.close() 
conn.close() 


将 以 上 程序 保存 为 createdb py， 运 行 后 即 可 创建 一 个 数据 库 。 若 创建 失败 ， 将 会 产生 错误 。 

除了 标准 的 Python 的 DB API 外 ，SQLite 还 具有 自身 的 API。 上 述 脚 本 使 用 SQLite APL， 
但 是 请 注意 , 这 个 API 与 Python 的 DB API 非 常 类 似 。 本 节 主 要 描述 createdb py 脚本 中 的 SQLite 
特有 代码 。 

如 下 语句 使 用 SQLite 创建 了 一 个 connection 对 象 : 


conn=sqhte3.connect('sample database') 


这 里 得 到 一 个 cursor 对 象 。cursor 对 象 用 于 创建 3 个 表 ， 并 定义 这 些 表 上 的 索引 。 

createdb .py 脚本 调用 该 连接 的 commitO 方 法 以 将 所 有 修改 保存 到 磁盘 上 。 

SQLite 将 所 有 数据 保存 到 文件 sample database 中 。 在 运行 createdb py 脚本 之 后 ,可 在 Python 
目录 中 看 到 该 文件 。 


12.2.3 定义 表 


第 一 次 建立 一 个 数据 库 时 ， 需 要 定义 一 些 表 及 其 之 间 的 关系 。 为 此 ， 可 以 使 用 SQL 中 称 为 
数据 定义 语言 (Data Definition Language，DDL) 的 部 分 。DDL 使 用 create 操作 创建 表 ， 使 用 drop 
操作 删除 它们 。 语 法 格式 如 下 : 


create table tablename (columnmn type column type. ... ) 
drop table tablename 


为 外 ，alter table 命令 用 于 修改 已 有 的 表 。 这 里 不 再 资 述 。 

遗憾 的 是 ，SQL 并 不 是 完全 标准 的 语言 ， 和 而 且 每 个 数据 库 对 各 目的 茶 些 部 分 的 处 理 是 不 同 
的 。DDL 就 属于 还 没有 被 标准 化 的 SQL 部 分 。 因 此 ， 当 定义 表 时 ， 尺 管 基本 概念 是 相同 的 ， 
但 不 同 的 数据 库 所 文 持 的 SQL 还 是 有 所 区 别 。 


使 用 Python 的 DB API 


Python 对 关系 数据 库 的 支持 开始 于 一 些 特定 的 解决 方案 ， 每 种 解决 方案 与 每 个 特定 的 数据 
库 ( 例 如 Oracle) 建 立 连 接 。 每 个 数据 库 模 块 创 建 上 自身 的 API， 这 些 API 对 数据 库 而 言 是 高 度 特 
有 的 ， 因 为 每 个 数据 库 提 供 商 都 根据 自己 的 需要 发 展 自身 的 API。 在 把 为 一 个 数据 库 编写 的 代 
码 移植 到 另 一 个 数据 库 时 ， 需 要 完全 重新 编写 以 及 重新 测试 全 部 代码 ， 这 给 程序 员 带 来 极 大 的 
痛 苗 ， 也 使 对 每 个 数据 库 的 支持 变 得 更 加 困难 。 

但 是 ， 多 年 来 Python 已 经 成 熟 到 可 以 提供 通用 的 数据 库 API， 称 为 DB API。 一 些 特 有 的 
模块 使 Python 脚本 能 够 与 不 同 的 数据 库 进行 通信 ， 例 如 DB2、PostgreSQL 等 。 然 而 ， 所 有 这 
些 模块 都 支持 通用 的 DB API， 当 编写 一 些 访 问 数据 库 的 脚本 时 ， 这 使 得 工作 变 得 更 加 容易 。 
本 节 将 介绍 这 种 通用 的 DB API。 
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DB API 提供 了 使 用 数据 库 的 最 低 标准 ， 并 尽 可 能 使 用 Python 的 结构 和 语法 。 这 种 API 包 
e 连接 ， 包 含 如 何 连 接 到 数据 库 的 指导 原则 。 

执行 语句 和 存储 过 程 ， 使 用 游标 查询 、 更 新 、 插 入 和 删除 数据 。 

事务 ， 文 持 提 交 和 回 深 事 务 。 

检查 数据 库 模 块 以 及 数据 库 和 表 结 构 的 元 数据 。 

定义 一 些 错 误 的 类 型 。 

下 面 将 详细 介绍 Python 的 DB API。 


12.3.1 下 载 DB API 模块 


针对 每 个 需要 访问 的 数据 库 ， 必 须 下 载 相 应 的 、 单 独 的 DB API 模块 。 例 如 ， 如 果 需 
访问 Oracle 和 MySQL 数据 库 ， 那 么 必须 先 下 载 Oracle 和 MySQL 的 数据 库 模块 。 

除了 SQL Server 之 外 , 大 多 数 主 流 数据 库 的 相应 模块 都 是 存在 的 。 然 而 ， 也 可 以 使 用 ODBC 
模块 访问 SQL Server。 实 际 上 ， 通 过 在 Windows 上 使 用 ODBC， 或 者 在 UNIX( 包 括 Mac OS Xx) 
或 Linux 上 使 用 ODBC 桥 ，mxODBC 模块 可 以 与 大 多 数 数 据 库 进行 通信 。 如 果 需 要 这 样 做 ， 可 
以 通过 在 线 搜索 天 于 这 些 术 语 的 更 多 信息 来 看 一 看 其 他 人 的 做 法 。 

请 下 载 需要 的 模块 。 按 照 各 个 模块 日 融 的 操作 指南 安装 它们 。 

对 于 某 些 数据 库 ， 例 如 Oracle， 需 要 从 很 多 彼此 间 稍 微 有 些 差 别 的 模块 中 做 出 选择 。 应 访 
选择 那 种 看 起 来 最 能 满足 需求 的 模块 。 一 旦 确认 所 有 必要 的 模块 ， 便 可 以 开始 使 用 连接 了 。 


12.3.2 ”创建 连接 

connection 对 象 提 供 了 一 种 在 脚本 与 数据 库 程 序 间 进 行 通 信 的 方法 。 注 意 ， 这 里 假设 数据 
库 在 单个 进程 (或 看 干 进程 ) 中 运行 。 各 个 Python 数据 库 模 块 连接 到 数据 库 ， 但 不 包括 数据 库 程 
序 本 喘 。 

每 个 数据 库 模块 需要 提供 一 个 连接 函数 ， 它 返回 一 个 connection 对 象 。 传 递 给 连接 函数 的 
各 个 参数 随 着 模块 以 及 与 数据 库 通 信 的 需要 而 变化 。 表 12-6 所 示 是 最 第 见 的 参数 。 


表 12-6 ”连接 函数 的 最 常见 参数 


参数 用 法 
dsn 数据 源 名 称 ， 来 自 于 ODBC 术语 ， 通 常 包 括 数据 库 的 名 称 及 其 运行 时 所 在 的 服务 器 名 称 
host 运行 数据 库 的 主机 或 网 络 系统 名 称 
database 数据 库 的 名 称 
User 连接 到 数据 库 的 用 户 名 


yassword 给 定 用 户 名 的 密码 


例如 ， 可 以 使 用 如 下 代码 作为 指导 : 


conn = dbmodule.connect(dsn—localhostMYDB'.user—'tiger',password—'scott’) 


有 了 connection 对 象 之 后 ， 就 可 以 使 用 事务 了 (本 章 稍 后 会 介绍 这 方面 的 内 容 )。 关 闭 连接 
以 释放 系统 资源 ， 特 别 是 数据 库 资源 ， 然 后 获取 一 个 游标 。 


12.3.3 数据库 的 CRUD 操作 


游标 是 一 种 Python 对 象 ， 它 使 开发 人 员 能 够 操纵 数据 库 。 在 数据 库 术 语 中 ， 游 标 位 于 数据 
库 中 某 个 或 大 和 干 表 中 的 特定 位 置 ， 有 点 类 似 于 编辑 文档 时 屏幕 上 的 光标 ， 不 同 的 是 光标 被 定位 
于 某 个 像素 位 置 。 

为 了 获取 一 个 游标 ， 需 要 调用 connection 对 象 的 cursor0 方 法 : 


cursor = conn.cursor() 


一 旦 获取 一 个 游标 ， 就 可 以 对 数据 库 执行 各 种 操作 了 ， 例 如 插入 一 些 记录 
输入 如 下 脚本 ， 并 将 文件 命名 为 insertdata.py: 


Inport os 
limport sqlite3 


conn—=sqlite3.connect('sample database') 
cursor = conn.cursor() 


# Create employees 

cursor.execute(™"" 

msert Into employee(empid,firsthame.lastname.manager.dept.phone) 
values(]1.Ernc',Foster-Johnson'.l.1.SsSS-S5555")""") 


cursor.execute(™" 

Insert Into employee(empid,firsthname,lasthame.manager.dept.phone) 
values(2,'Peter',"Tosh',2,3,555-$5554")""") 

cursor.execute(™™" 

Insert nto employee(empid,firsthame,lastname.manager.dept.phone) 
values(3,Bunny', Wailer ,2,2,555-5553")""") 


# Create departments 
cursor.execute(™™" 
Insert into department (departmentid.name.manager) 


values( 1 .development 上 


cursor.execute(™™™" 
Insert mto department(departnmentid.name,.manager) 
values(2,ga.2)"™"") 


cursor.execute(™"™" 


Insert mto department(departmentid .name,.manager) 
values(3,'0perations',2)"™") 
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# Create users 


Insert nto user(userid.username.employee1d) 
values(] enct 1 


cursor.execute(™"" 
msert nto user(userid.username.employee1d) 
values(2,'tosh',2)""") 


msert nto user(userid.username.employee1d) 
values(3,bunny’.3)"™"") 


conn.commit() 
cursor.close() 


conn.close() 


当 运 行 上 述 脚本 时 ， 除 非 产生 错误 ， 人 否则 将 不 会 看 到 任何 输出 。 
上 述 脚 本 的 前 几 行 建立 了 数据 库 连 接 ， 并 创建 了 一 个 cursor 对 象 : 
1mport os 

1mport sqlite3 

conn=sqlite3.connect('sample database’) 

Cursor = conn.cursor() 


注意 连接 到 SQLite 数据 库 的 方式 。 如 条 要 连接 到 另 一 个 不 同 的 数据 库 ， 可 以 根据 需要 ， 用 


数据 库 特 有 的 模块 代 瞪 此 模块 ， 并 修改 调用 ， 使 其 使 用 该 数据 库 模 块 的 connect0 函 数 。 


接 下 来 的 几 行 执行 一 些 SQL 语句 , 将 几 行 数据 插入 之 前 创建 的 3 个 表 中 : 雇员 表 、 部 门 表 


和 用 户 表 。cursor 对 象 的 execute0 方 法 执行 了 如 下 SQL 语句 : 


/| 


cursor.execute(™™" 
Insert mto employee(empid.,firstname,lastname.manaeer,dept.phone) 
values(2,'Peter', Tosh',2.3,555-5554)""") 


此 例 根 据 需 要 使 用 一 个 三 引号 字符 串 实 现 了 对 一 些 行 的 跨越 。 如 果 可 以 在 多 行 中 格式 化 命 
一 些 SQL 命令 ， 特 别 是 那些 租 入 Python 脚本 中 的 命令 ， 将 变 得 更 容易 理解 。 

必须 提交 该 事务 ， 以 将 所 有 的 修改 保存 到 数据 库 中 : 

conn.commat() 

注意 ， 要 对 connection 对 象 而 不 是 cursor 对 象 调用 commit0 方 法 。 

当 脚 本 完成 时 ， 关 闭 游 标 和 连接 以 释放 资源 。 在 像 这 样 的 很 简短 的 脚本 中 ， 这 一 点 可 能 看 


起 来 并 不 重要 ， 但 这 有 助 于 数据 库 程 序 和 Python 脚本 释放 它们 的 资源 。 
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cursor.close() 
conn.close() 


现在 已 经 具备 一 些 少量 的 样本 数据 ， 可 以 通过 DB API 的 其 他 部 分 (如 数据 得 询 ) 使 用 它们 了 。 
下 面 的 脚本 实现 了 一 个 简单 的 查询 ， 它 在 雇员 表 和 部 门 表 上 执行 连接 操作 。 


1mport os 
1mport sqlite3 
conn=sqlite3.connect('sample database’) 
cursor = conn.cursor() 
cursor.execute(™™" 
select employee.firstname. employee.lastname. department.name 
from employee, department 
where employee.dept = department.departmentid 
order by employee.lastname desc 
0 ) 
for row mn cursor.fetchall(): 

print(row) 
cursor.close() 
conn.close() 


将 这 上段 脚本 保存 为 simplequery.py。 当 运行 此 脚本 时 ， 可 以 看 到 类 似 下 面 的 输出 : 


(Bunny', Wailer' "qa') 
(Peter, "TIosh ‘operations’) 
(Ene'. Foster-Johnson development) 


此 脚本 采用 与 之 前 的 脚本 相同 的 方式 对 connection 和 cursor 对 象 进 行 初始 化 。 然 而 ， 此 脚 
本 同 cursor 对 象 的 execute0 方 法 传递 了 一 个 简单 的 连接 查询 。 此 查询 从 雇员 表 中 选择 两 列 ， 从 
部 门 表 中 选择 一 列 。 


注意 : 
这 确实 是 一 个 简单 的 查询 ， 但 是 ， 即 使 如 此 ， 也 应 该 像 此 处 显示 的 一 样 ， 对 查询 语句 进行 


格式 化 ， 以 便 它 们 是 可 读 的 。 


当 处 理 一 些 用 户 界 面 时 ， 经 常 需要 将 数据 库 中 存储 的 各 个 DD 扩展 成 人 类 可 读 的 值 。 例 如 ， 
在 本 例 中 ， 查 询 语 句 扩 展 了 部 门 的 了 D 来 查询 部 门 名称 。 不 要 期 望 人 们 能 记 住 这 些 数 值 ID 的 
入 

该 查询 语句 还 按照 雇员 的 姓 对 结果 集 进 行 了 降序 排列 (这 意味 着 以 字母 表 的 起 点 作为 开始 ， 
正 符 合 人 们 的 习惯 。 然 而 ， 也 可 以 使 它们 以 升序 排列 )。 

在 调用 execute0 方 法 之 后 ， 对 于 能 够 找到 的 那些 数据 ， 将 它们 存储 到 cursor 对 象 中 。 可 以 
使 用 fetchall0 方 法 提取 这 些 数据 。 

注意 : 

也 可 以 使 用 fetchone0 方 法 从 结果 集中 一 次 获取 一 行 。 
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(Bunny， Waller. "qa') 

(Peter, "Tosh', ‘operations’) 

(Enc'. 'Foster-Johnson', "development ) 

可 以 将 此 例 作为 创建 其 他 查询 的 模板 。 输 入 以 下 脚本 ， 并 将 文件 命名 为 finduser py: 
1mport sqlite3 

conn=sqlite3.connect('sample database’) 

Cursor = conn.cursor() 

username = Dunny’ 

query= 

select u.username.e.firsthame.e.lastname.m.firsthame.m.lastname. d.name 
from user u, employee e. employee m department d Where username=? 
and u.employeeld = e.empid 

and e.manager = m.empid 

and e.dept = d.departmentid 


了 


cursor.execute(query. (username.)) 

for row Im cursor.fetchall(): 
(username.firstname.lastname.mer firsthame.mer lasthame.dept) = row 
name=~firstname + " " + lasthname 
manager—mer firsthame +""+mer lasthame 
print(usemame.":".name,"managed by".manager."m",dept) 

cursor.close() 

conn.close() 


当 运 行 上 述 脚本 时 ， 将 会 看 到 类 似 下 面 的 结 末 : 
bunny : Bunny Waller managed by Peter Tosh m qa 


需要 传递 一 个 用 户 名 以 实现 数据 库 中 的 查询 。 这 个 用 户 名 在 数据 库 中 必须 有 效 。 在 此 例 中 ， 
bunny 是 之 前 插入 数据 库 中 的 用 户 名 。 

上 述 脚 本 执行 了 一 个 连接 , 它 位 于 所 有 三 个 示例 表 上 , 另外 还 通过 表 的 别名 创建 了 短 查 询 。 
目的 是 ， 通 过 查找 用 户 名 ， 找 出 数据 库 中 的 给 定 用 户 。 此 脚本 也 显示 了 如 何 将 经 理 的 ID 扩展 为 
经 理 的 姓名 ， 以 及 如 何 将 部 门 的 卫 扩展 为 部 门 的 名 称 。 所 有 这 些 都 使 输出 的 可 读 性 变 得 更 强 。 

这 个 示例 也 展示 了 如 何 从 每 行 中 提取 出 一 些 数据 并 放 入 Python 变量 。 例 如 : 


(username.firstname.lasthame.mer firstname.mer lastname.dept) = row 


请 注意 ， 这 并 不 是 什么 新 内 容 。 请 到 第 3 章 查 看 更 多 关于 Python 元 组 的 信息 ， 一行 就 是 一 
个 元 组 。 

然而 ， 此 脚本 的 一 个 很 重要 的 新 特征 是 问号 的 使 用 ， 使 得 可 以 使 用 动态 数据 创建 查询。 当 
调用 Cursor 类 的 execute0 方 法 时 , 可 以 传递 一 个 包含 动态 数据 的 元 组 ,execute0 方 法 将 会 对 SQL 
语句 中 的 那些 问号 进行 填充 (此 例 使 用 了 只 包含 一 个 元 素 的 元 组 )。 使 用 元 组 中 的 每 个 元 素 按 顺 
序 代替 问号 。 因 此 ， 动 态 数据 的 数量 与 SQL 语句 中 问号 的 数量 必须 相同 ， 这 非常 重要 ， 如 下 
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select u.usemame.e.firstname.e.lasthname.m.firshame.m.lasthame. d.name 
from User UL employee e, employee m., department d where usemame=? 
and u.employeeld = e.empid 

and e.manager = m.empid 

and e.dept = d.departmentid 


于 下 


cursor.execute(query, (usemame.)) 


当 希 望 开 始 对 各 个 表 中 的 行进 行 更 新 时 ， 此 例 中 使 用 的 查询 非常 有 用 ， 因 为 用 户 希 望 输入 
一 些 有 意义 的 值 。 需 要 使 用 一 些 SQL 语句 将 用 户 输入 转换 为 必要 的 ID。 

例如 ， 如 下 脚本 能 够 对 雇员 的 经 理 进行 修改 。 

输入 如 下 脚本 ， 并 将 文件 命名 为 updatemgrpy: 


iimport sqlite3 
conn—=sqlite3.connect('sample database’) 

cursor = conn.cursor() 

newmer = sys.arev[2] 

employee = sys.arev| 1| 

# Query to find the employee ID. 

query 一 再 生生 是 下 和 

select e.empld 

from user u, employee e 

where Usemame=y and u.employeeld = e.empid 


于 于 于 


cursor.execute(query,(Nnewmer,)); 
for row In cursor.fetchone(): 

1 (row != None): 

merid = row 

# Note how we use the same query. but with a different name 
cursor.execute(query,(employee.)): 
for row In cursor.fetchone(): 

if (row != None): 


empid = row 
# Now. modity the employee 
cursor.execute("update employee set manager=? where empid=?", (mernid.emp1id)) 
conn.commt() 
cursor.close() 
conn.close() 


当 运 行 上 述 脚本 时 ， 赶 要 传递 用 户 的 姓名 及 其 经 理 的 姓名 以 进行 更 新 。 这 两 个 姓名 都 是 用 
户 表 中 的 用 记名 。 例 如 : 
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$ python finduser.py bunny 
bunny : Bunny Waller managed by Peter Tosh im qa 


$ python updatemer.py bunny erict 

$ python finduser.py bunny 

bunny : Bunny Waller managed by Eric Foster-Johnson In qa 

此 例 的 输出 分 别 显示 了 雇员 行 更 新 前 后 的 情况 ， 证 实 updatemgrpy 脚本 起 了 作用 。 
updatemgr.py 脚本 再 要 用 户 提供 两 个 值 : 将 要 更 新 的 雇员 和 经 理 的 用 户 名 。 这 两 个 名 称 必 


须 是 已 经 存储 在 数据 库 中 的 用 户 名 ,它们 通过 使 用 一 个 简单 的 查询 被 转换 为 两 个 DD。 这 种 做 法 
的 效率 不 是 很 高 ， 因 为 包括 对 数据 库 的 两 次 额外 访问 。 一 种 效率 更 高 的 做 法 是 在 update 语句 中 
执行 内 部 select 语句 。 然 而， 为 简单 起 见 ， 两 个 分 开 的 查询 更 容易 让 人 理解 。 


本 例 还 显示 了 Cursor 类 的 fetchone0 方 法 的 用 法 。 最 后 的 SQL 语句 对 给 定 用 户 的 雇员 行进 


行 了 更 新 ， 使 其 有 了 新 的 经 理 。 


下 一 个 示例 使 用 一 种 类 似 的 技术 解雇 一 名 雇员 。 
输入 如 下 脚本 ， 并 将 文件 命名 为 terminate py: 


Iimport sqlite3 
conn—=sqlite3.connect('sample database’) 
cursor = conn.cursor() 
employee=sys.arev| 1] 
# Query to find the employee ID 
query=" 
select e.empid 
from user u, employee e 
where usemame~=? and u.employeeld = e.empid 
cursor.execute(query.(employee.)): 
for row In cursor.fetchone(): 

if (row != None): 

empld = row 

# Now., modify the employee. 
cursor.execute("delete from employee Where empid=?", (empid.)) 
conn.commit() 
cursor.close( ) 
conn.close() 


当 运 行 上 述 脚本 时 ， 需 要 传递 要 解雇 的 那个 人 的 用 户 名 。 除 非 脚 本 产生 错误 ， 人 否则 不 会 看 


到 任何 输出 : 


$ python finduser.py bunny 

bunny : Bunny Waller managed by Enc Foster-Johnson m qa 
$ python terminate.py bunny 

$ python finduser.py bunny 


此 脚本 使 用 与 updatemgr.py 脚本 相同 的 技术 ， 通 过 执行 一 个 最 初 的 得 询 得 到 给 定 用 户 名 的 
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雇员 ID， 然后 在 后 面 的 SQL 语句 中 使 用 此 雇员 ID.。 在 最 后 的 SQL 语句 中 ,此 脚本 从 雇员 表 中 
删除 该 雇员 。 


12.3.4 ”使 用 事务 并 提交 结果 


对 于 每 个 连接 对 象 ， 当 它 正 在 进行 某 项 活动 时 , 会 同时 管理 一 个 事务 。 使 用 SQL 时 ， 只 有 
在 提交 了 事务 时 ， 数 据 才 被 更 改 。 数 据 库 保 证 要 么 执行 所 有 的 修改 ， 要 么 不 做 任何 修改 。 因 此 ， 
数据 库 不 会 处 于 一 种 不 确定 的 或 可 能 不 正确 的 状态 。 

调用 连接 对 象 的 commit0 方 法 以 提交 事务 : 


conn.comnt() 


注意 ， 有 关 事 务 的 各 个 方法 是 Connection 类 的 一 部 分 ， 而 不 是 Cursor 类 的 一 部 分 。 
如 果 有 错误 发 生 ， 比 如 抛 出 可 以 处 理 的 异常 ， 那 么 应 该 调用 rollback0 方 法 以 回 深 不 完全 事 
务 的 效果 ， 此 操作 将 保证 使 数据 库 恢 复 到 局 动 该 事务 之 前 的 状态 : 


conn.rollback() 


可 以 对 事务 进行 回 深 的 能 力 是 非常 重要 的 ， 因 为 可 以 在 保证 数据 库 不 被 改变 的 情况 下 处理 
一 些 错误 。 男 外 ， 回 深 对 于 测试 也 是 非常 有 用 的 。 可 以 将 对 大 量 行 执行 的 插入 、 修 改 和 删除 操 
作 作为 单元 测试 的 一 部 分 ， 然 后 回 深 事 务 以 撤销 所 有 更 改 的 效果 。 这 使 得 单元 测试 的 运行 不 会 
对 数据 库 产 生 任何 永久 更 改 。 另 外 ， 还 允许 重复 运行 单元 测试 ， 因 为 每 次 运行 都 会 重 置 数据 。 


12.3.5 ”检查 模块 的 功能 和 元 数据 


DB API 定义 了 几 个 需要 在 模块 级 别 定 义 的 全 局 变量 。 可 以 使 用 这 些 全 局 变量 确定 关于 数 
据 库 模块 的 信息 及 其 支持 的 一 些 特征 。 表 12-7 列 出 了 这 些 全 局 变量 。 


表 12-7 需要 在 模块 级 别 定义 的 全 局 变量 
全 局 变量 保存 值 
apilevel 对 于 DB API2.0 应 该 保存 “2.0”， 对 于 DB API 1.0 应 该 保存 “1.0” 
定义 了 在 SQL 语句 中 如 何 显 示 动 态 数据 的 占 位 符 ， 包 括 的 值 如 下 : 
“qmark” 一 一 使 用 问号 ， 如 本 章 中 的 示例 所 示 
“numeric” 一 一 使 用 一 种 位 置 数 字 的 方式 ， 带 有 “:1”“:2” 等 


paramstyle | smed” 一 使 用 冒号 和 每 个 参数 的 名 称 ， 如 :name 
“format” 一 一 使 用 ANSIC Sprintf 格式 代 码 ， 例 如， 对 于 字符 串 使 用 %s， 对 于 整数 使 用 %d 
“pyformat” 一 一 使 用 Python 的 扩展 格式 代码 ， 如 %(name)s 
注意 : 


另外 ， 切 记 pydoc 是 非常 有 益 的 。 可 以 使 用 pydoc 显示 关于 模块 (例如 数据 库 模 块 ) 的 信息 。 


可 以 利用 cursor 对 象 的 definition 属性 查看 返回 数据 的 信息 。 此 信息 应 该 是 一 个 序列 的 集合 ， 
每 个 序列 包含 7 个 元 素 ， 对 应 于 结果 数据 中 的 一 列 。 这 些 序列 包含 如 下 各 项 : 


(name, type code, display slze. Intemal size, precision., scale, null ok) 
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除了 前 两 项 之 外 ， 其 余 各 项 都 可 以 使 用 None。 


12.3.6 ”处 理 馆 性 


错误 总 会 发 生 。 对 于 数据 库 ， 经 贡 会 用 生 很 多 错误 。DB API 定义 了 大 量 存在 于 每 个 数据 
库 模 块 中 的 错误 。 表 12-8 列 出 了 这 些 异 常 。 


表 12-8 DB API 定义 的 错误 


错误 用 法 
Wamine 用 于 非 致 命 的 问题 ， 必 须 定义 为 StandardError 的 子 类 
Emor 所 有 错误 的 基 类 ， 必 须 定义 为 StandardError 的 子 类 
InterfaceError 用 于 数据 库 模 块 中 的 错误 ， 而 不 是 数据 库 本 身 的 错误 ， 必 须 定义 为 Error 的 子 类 
DatabaseError 用 于 数据 库 中 的 错误 ， 必 须 定 义 为 Emor 的 于 类 
DataError DatabaseError 的 子 类 ， 是 指数 据 中 的 错误 
i DatabaseError 的 子 类 , 是 指 那些 类 似 于 丢失 数据 库 连 接 的 错误 。 这 些 错误 一 般 在 Python 
脚本 设计 者 的 控制 之 外 
IntegnityError DatabaseError 的 子 类 ， 用 于 可 能 破坏 关系 完整 性 的 情况 ， 例 如 唯一 性 约束 或 外 键 约束 
InternalError DatabaseError 的 子 类 ， 是 指数 据 库 模块 内 部 的 错误 ， 例 如 游标 未 被 激活 


ProerammineError | DatabaseError 的 子 关 ， 是 指 那些 类 似 于 错误 的 表 名 等 由 程序 员 造 成 的 问题 
NotSupportedError | DatabaseError 的 子 类 ， 是 指 试图 调用 不 支持 的 功能 


使 用 mysql-connector 


MySQL 钙 ， Web 世界 中 使 用 最 广泛 的 数据 库 。SQLite 的 特点 是 轻 量 级 、 可 艇 入 ， 但 不 能 承 
受 高 并 发 访问 ， 适 合 果 面 和 移动 应 用 。MySQL 是 为 服务 堪 问 设计 的 数据 库 ， 能 承受 高 并 发 访问 ， 
同时 占用 的 SQLite。 

此 外 , MySQL 内 部 有 多 种 数据 库 引 擎 , 最 第 用 的 数据 库 引 擎 是 文 持 数据 库 事务 的 InoDB。 
本 节 将 向 大 家 介绍 使 用 mysql-connector 来 连接 使 用 MySQL, mysql-connector 是 MySQL 官方 提 
供 的 驱动 右 。 

可 以 使 用 pip 命令 来 安装 mysql-connector: 


python3 -m pip install mysql-connector 

使 用 以 下 代码 测试 mysql-connector 是 否 安 装 成 功 : 
import mysqLconnector 

执行 以 上 代码 ， 如 果 没 有 产生 错误 ， 则 表明 安装 成 功 。 
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12.4.1 连接 MySQL 数据 库 
通过 mysql-connector 连接 MySQL 数据 库 的 语法 格式 如 下 : 


mydb = mysql.connector.connect(host, user, passwd) 


其 中 ，host 代表 数据 库 主机 地 址 ，user 代表 数据 库 用 户 名 ，passwd 代表 数据 库 密码 。 执 行 
后 会 返回 一 个 mysql.connector 连接 对 象 。 示 例如 下 : 


1mport mysql.connector 
mydb = mysql.connector.connect( 


host="localhost"，  # 数据 库 主 机 地 址 


USer—"root", # 数据 库 用 户 名 
passwd=" " # 数据 库 密 码 

) 

prnt(mydb) 


<mysql.connector.connection. MySQL Connection object at 0x000001]EBE12BAB70> 


12.4.2 ”创建 数据 库 


和 DB API 的 方式 一 样 ， 要 操作 数据 库 ， 首 先 要 从 connect 对 象 获 得 游标 对 象 ， 然 后 通过 游 
标 来 创建 数据 库 。 示 例 程序 如 下 : 


import mysql.connector 

mydb = mysql.connector.connect( 
host="localhost", 

USeI= Tooat . 

passwd—"™ 

) 

mycursor = Imydb.cursorQ) 
mycursor.execute("CREATE DATABASE test") 


执行 以 上 程序 ， 将 会 在 本 地 MySQL 服务 器 中 创建 一 个 空 的 数据 库 test。 
要 想 验 证 数据 库 是 否 已 经 创建 成 功 ， 可 以 使 用 show databases 语句 来 查看 数据 库 是 否 存在 ， 
示例 程序 如 下 : 


import mysql.connector 
mydb = mysql.connector.connect( 


host="localhost". 

USeI 一 Toot ， 

passwd="™" 

) 

Imnycursor = mydb.cursor() 
mycursor.execute("show databases") 
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for x m mycursor: 

print(x) 
执行 以 上 代码 ， 输 出 结果 如 下 : 

RESTART: D:/pyproject/showdb.py 

(nformation schema.'.) 
(examdb ,) 
(mysql,) 
(pertormance schema',) 
(TWS',) 
(sys,) 
(test') 
由 此 可 以 看 到 刚才 创建 的 test 数据 库 。 
也 可 以 直接 连接 数据 库 ， 如 果 数 据 库 不 存在 ， 会 输出 错误 信息 。 示 例 代 码 如 下 : 


import mysql.connector 
mydb = mysql.connector.connect( 
host="localhost", 


database="test" 
) 


12.4.3 创建 数据 表 


创建 数据 表 需 要 使 用 create table 语句 ， 创 建 数据 表 前 ， 需 要 确保 数据 库 己 存在。 以 下 代码 
创建 一 个 名 为 books 的 数据 表 : 


import mysql.connector 
mydb = mysql.connector.connect( 
host="localhost", 


database="test" 


) 
mycursor = mydb.cursor() 
mycursor.execute("create table books(name VARCHAR(255), author VARCHAR(255S))") 


运行 以 上 程序 ， 将 在 test 数据 库 中 创建 books 数据 表 ， 如 图 12-1 所 示 。 


中 一 | 展 尖 -一 
I FP 
连接 用 户 这 视图 函数 事件 查证 授 圳 备注 
连接 四 打开 表 四 设计 表 国 新 建 表 Dg 删除 表 因 导入 向 导 四 导出 向 导 
| v ”aecalheost nm | 国 books 


| Hl exwamdb 


| information schema 


时 
we 
加 


已 选择 1 站 对 类 | localhost 用 户 ; rect 数据 库 : test 


12-1 创建 的 books 数据 表 
也 可 以 使 用 show tables 语句 来 查看 数据 表 是 否 已 存在 ， 程 序 如 下 : 


import mysql.connector 

mydb = mysql.connector.connect( 
host="]ocalhost", 

USeI 一 Toot ， 

PasswWd=”. 

database="test" 

) 

Imycursor = mydb.cursor() 
mycursor.execute("show tables") 
for x mn mycursor: 


Print(X) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
RESTART: D:/pyproject/showdb1.py 
(books.) 
由 此 可 见 ， 己 经 在 test 数据 库 中 创建 了 books 数据 表 。 


12.4.4 主键 设置 


创建 数据 表 的 时 候 ， 一 般 都 会 设置 主键 (Primary Key)， 可 以 使 用 int auto _ increment primary 
key 语 癸 来 创建 主键 ， 主 键 的 起 始 值 为 1， 逐步 递增 。 
如 果 已 经 创建 了 数据 表 ， 需 要 使 用 alter table 来 给 数据 表 添加 主键 ,例如 给 books 数据 表 添 
加 主键 ,程序 如 下 : 


1mport mysql.connector 

mydb = mysql.connector.connect( 
host="localhost". 

USeI= TOOt . 

passwd="", 

database="test" 
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) 
Inycursor = Imydb.cursor() 
Inycursor.execute("alter table books add column ld mt auto Increment primary key") 


也 可 以 在 创建 数据 表 的 时 候 直 接 指定 主键 ， 代 码 如 下 : 


mycursor.execute("create table sites (1d mt auto Increment primary key, name varchar(255), url varchar(235))") 


12.4.5 ”插入 数据 


插入 数据 需要 使 用 insert into 语句 。 插入 数据 时 ,可 以 插入 单条 记录 ,也 可 以 批量 插入 多 条 
记录 。 
例如 ， 疝 books 数据 表 中 插入 一 条 记录 ， 程 序 如 下 : 


Import mysql.connector 

mydb = mysqgl.connector.connect( 

host="localhost", 

UseI—"TOOt", 

passwd="", 

database—"test" 

) 

Inycursor = mydb.cursor() 

sq] = "nsert mto books(name, author) values (%os, 9%0s)” 
val = ("a thand", "vwv") 

mycursor.execute(sql, val) 

mydb.commit() # 数据 表 中 的 内 容 有 更 新 时 ， 必 须 使 用 这 条 语句 
print(mycursorTowcount "记录 插入 成 功 ") 


执行 以 上 程序 ， 输 出 结果 如 下 : 
1 记录 插入 成 功 


批量 插入 需要 使 用 executemany0 方 法 ， 该 方法 的 第 二 个 参数 是 一 个 元 组 列表 ， 其 中 包含 要 
插入 的 数据 。 示 例 程 序 如 下 : 


import mysql.connector 
mydb = mysql.connector.connect( 
host="localhost". 


database="test" 

) 

mycursor = mydb.cursor() 

sq = "insert nto books (name. author) Values (%0s, %0s)" 
val=| 

(mylove', '000"). 

(mydear’, vwv’), 

(激荡 三 十 年 ' ' 吴 晓 波 '), 
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(人 工 智 能 , "李开复 ") 

] 

Inycursor.executemany(sql, val) 

mydb.commit0# 数据 表 中 的 内 容 有 更 新 时 ， 必 须 使 用 这 条 语句 
print(mycursor.rowcount, "记录 插入 成 功 。") 


执行 以 上 程序 ， 输 出 结果 如 下 : 
4 记录 插入 成 功 
执行 完 以 上 代码 后 , 可 以 看 看 数据 表 中 的 记录 , 插入 的 数据 记录 如 图 12-2 所 示 。 这 里 注意 ， 


如 果 写 入 的 中 文 记录 变 成 了 问号 , 这 是 数据 编码 问题 , 实际 开发 中 要 留意 , 当 字 段 为 char、varchar 


等 类 型 时 ， 可 设置 为 utf-8 编码 。 
文件 编 襄 童 罩 窗口 帮助 
加 导入 向 导 站 导出 向 导 “算计 向 导 网 格 查 看 [三 | 表单 音 看 .| 备注 


oks @test (localhost) - 龙 一 口 


name author | A 
a thand WY 


mylove DOD 


1 
和 
mydear wv 3 
| ” 激 蕊 三 十 年 哎 晓 流 4 
|T 人 工 智能 ”李开复 5 


vl 
Hi 本 本 el 中 一 Xeo 息 胡 1 定 呈 入 
UPDATE ‘books” SET “id*="4' WHE 第 5 条 记录 ([ 共 5 务 ) 于 1 页 


图 12-2 插入 的 数据 记录 
如 果 想 在 插入 数据 记录 后 ， 获 取 数 据 记 录 的 也 ， 可 以 使 用 以 下 代码 : 


Import mysql.connector 

mydb = mysql.connector.connect( 

host="localhost". 

USelI 一 Toot . 

passwd—"", 

database="test" 

) 

mycursor = mydb.cursorO) 

sql = "insert into books(name, author) Values (%%s, %s)" 
val = ("Zhihu", "aaa") 

mycursor.execute(sql, val) 

mydb.commat() 

print("1 条 记录 已 插入 ，ID 为 ", mycursorlastrowid) 


执行 以 上 代码 ， 输 出 结果 如 下 : 
1 条 记录 已 插入 ， 卫 为 6 
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12.4.6 ”查询 数据 
查询 数据 需要 使 用 select 语句 ， 示 例 程序 如 下 : 


import mysqLconnector 
mydb = mysql.connector.connect( 
host="localhost", 
USeI 一 Toot . 
passwWd=-…. 
database="test" 
) 
DIVcUISOT = mydb.cursor() 
mycursor.execute("select * from books") 
We 
for x in myresult: 

print(x) 


执行 以 上 程序 ， 运 行 结果 如 下 : 


RESTART: D:/pyproject/select.py 
(a thand', ‘vvv’', 1) 
(mylove', '000', 2) 
(mydear, vvv', 3) 
(激荡 三 十 年 , ' 吴 晓 波 ', 4 
(人 工 智 能 , 李开复 ', 5) 
(Zhibhu', aaa, 6) 


也 可 以 读 取 指定 的 字段 ， 程 序 如 下 : 


mport mysql.connector 

mydb = mysql.connector.connect( 
host="localhost". 

user=" TOOt . 

passwd—="", 

database="test " 

) 

mycursor = mydb.cursor() 
mycursor.execute("select name. author from books") 
Inyresult = mycursor.fetchall() 

for x m myresult: 

print(X) 

执行 以 上 程序 ， 输 出 结果 如 下 : 
(a thand', ‘vvv’) 

(mylove', '000') 

(mydear，VVV) 

(激荡 三 十 年 ' 吴 晓 波 ") 

(人 工 智 能 ', ' 李 开 复 ) 
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(Zhihu 'aaan) 


如 果 只 想 读 取 一 条 数据 记录 ， 可 以 使 用 fetchone0 方 法 。 程 序 代 码 如 下 : 


import mysql.connector 

mydb = mysql.connector.connect( 
host="localhost". 

User=" TOOt . 

passwd—="", 

database="test" 

) 

Imnycursor = mydb.cursor() 
mycursor.execute("select * from books") 
myresult = mycursor.fetchone() 


print(myresult) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
(a thand', vwv', 1) 


12.4.7 where 条 件 语句 


如 果 要 读 取 指 定 条 件 的 数据 ， 可 以 使 用 where 语句 。 例 如 ， 要 找 出 作者 为 “李开复 ”的 所 
有 图 书 ， 代 人 码 如 下 : 


import mysql.connector 
mydb = mysql.connector.connect( 
host="localhost", 
USeI=" Toot . 
passwd—="", 
database=—"test" 
) 
mycursor = mydb.cursor() 
sq] = "select * from books where author 一 李开复 " 
mycursor.execute(sql) 
myresult = mycursor.fetchall( 
for x mn myresult: 
print(x) 
执行 以 上 程序 ， 输 出 结果 如 下 : 
(人 工 智能 ' 李开复 ,5) 
也 可 以 使 用 通配符 %， 示 例如 下 : 
import mysql.connector 
mydb = mysql.connector.connect( 


host="localhost", 
USeI 一 Toat . 
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passwd="", 
database="test" 
) 
mycursor = mydb.cursorO 
sql = "select * from books where author like % 开 %" 
mycursor.execute(sql) 
myresult = mycursor.fetchallO 
for x m myresult: 
print(x) 


执行 以 上 程序 ， 输 出 结果 和 上 面 的 例子 相同 。 
为 了 防止 数据 库 查询 发 生 SQL 注入 攻击 ， 可 以 使 用 %s 占 位 符 来 转 义 查询 的 条 件 : 


1mport mysql.connector 
mydb = mysql.connector.connect( 
host="localhost". 
USerI="IOOt . 
passwd—"", 
database="test" 
) 
mycursor = mydb.cursor) 
sql = "select * from books where author = %s" 
na 一 ("李开复 ".) 
mycursor.execute(sql, na) 
myresult = mycursor.fetchall(}) 
for x in myresult: 

print(x) 


12.4.8 排序 


要 对 查询 结果 进行 排序 ， 可 以 使 用 order by 语句 ， 默认 的 排序 方式 为 升序 ， 关键 字 为 ASC。 
如 果 要 设置 降序 排列 ， 可 以 使 用 关键 字 DESC 。 
例如 ， 按 id 字段 升序 排列 : 


Import mysql.connector 
mydb = mysql.connector.connect( 
host="localhost". 
USeI 一 Toot ， 
passwWd=”. 
database—"test" 
) 
Inycursor = mydb.cursor() 
sql = "select * from books order by 1d" 
mycursor.execute(sql) 
myresult = mycursor.fetchall(} 
for x m myresult: 
print(x) 
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执行 以 上 程序 ， 输 出 结果 如 下 : 


RESTART: D:/pyprolectasc.pV 


(athand，VvV. 1) 

Cmylove', '000', 2) 

Cmydear, vwv., 3) 

(激荡 三 十 年 , ' 吴 晓 波 ', 4) 

(人 工 智 能 , 李开复 .9) 

(Zhihu .aaa. 6) 

要 按 id 字段 降序 排列 ， 只 需要 把 SQL 语句 修改 成 如 下 即 可 : 


sql = "select * from books order by 1d desc" 


12.4.9 limit 语句 


如 果 要 设置 查询 的 数据 量 , 可 以 通过 limit 语句 来 指定 。 例如 , 要 读 取 数据 表 的 前 两 条 记录 ， 
示例 程序 如 下 : 

import mysql.connector 

mydb = mysql.connector.connect( 

host="localhost". 

USelI 一 Toot . 


Diycursor = mydb.cursor() 
mycursor.execute("select * from books lmt 2") 
myTresult = mycursor.fetchall() 
for x in myresult: 

print(x) 
执行 以 上 程序 ， 输 出 结果 如 下 : 

RESTART: D:/pyproject/ mit.py 

(a thand, vvv., 1) 
(mylove', '000', 2) 


如 果 要 从 第 二 条 记录 开始 读 取 前 三 条 记录 ， 可 以 使 用 offset 来 指定 起 始 记 录 : 

mycursor.execute("select * 人 rom sites limit 3 offset 1")#0 为 第 一 条 ，1 为 第 二 条 ， 以 此 类 推 
12.4.10 ”删除 记录 

删除 记录 需要 使 用 delete from 语句 。 例 如 ， 从 数据 表 中 删除 作者 为 vwv 的 数据 记录 : 

import mysql.connector 


inydb = mysql.connector.connect( 
host="localhost". 
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USeI= TOot . 

passwd—"", 

database="test" 

) 

mycursor = mydb.cursor() 

sql = "delete from books where author = vw" 
mycursor.execute(sql) 

mydb.commt() 

print(tmycursorrowcount ”条 记录 删除 ") 


执行 以 上 程序 ， 输 出 结果 如 下 : 


RESTART: D:/pyproject/del.py 
2 条 记录 被 删除 


以 上 程序 从 数据 库 中 删除 了 两 条 记录 。 
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需要 注意 的 是 ， 要 慎 用 delete 语句 ，delete 语句 要 确保 指定 了 where 条 件 语 句 ， 否 则 会 导致 


为 了 防止 数据 库 得 询 友 生 SQL 注入 攻击 ， 也 可 以 使 用 %s 占 位 符 来 转 义 删除 语句 的 条 件 。 


例如 : 


import mysql.connector 

mydb = mysql.connector.connect( 
host="localhost". 

USeI— TOOt . 

passwd="", 

database="test" 

) 

mycursor = Imydb.cursorQ) 

sql = "delete from books where author = %s" 
na=("000".) 

mycursor.execute(sql., na) 

mydb.commt() 

print(mycursor.rowcount, "条 记录 删除 ") 


12.4.11 更 新 数据 


要 修改 数据 表 中 的 记录 ， 可 使 用 update 语句 。 例 如 ， 修 改作 者 为 aaa 的 记录 ， 将 作者 改 为 


bbb， 示 例 程 序 如 下 : 


import mysql.connector 

mydb = mysql.connector.connect( 
host="localhost", 

USeI 一 Toot ， 

PasswWd=”. 

database="test" 

) 
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mycursor = mydb.cursor() 

sql = "update books set author = bbb' where author = 'aaa"" 
mycursor.execute(sql) 

mydb.commtO) 

print(mycursor.rowcount, "条 记录 被 修改 ") 


执行 以 上 代码 ， 输 出 结果 如 下 : 
] 条 记录 被 修改 


需要 注意 的 是 ，update 语句 要 确保 指定 了 where 条 件 语句 ， 否 则 会 导致 整 表 数据 被 更 新 。 
为 了 防止 数据 库 碍 询 发 生 SQL 注入 攻击 , 我 们 可 以 使 用 %s 占 位 符 来 转 义 更 新 语句 的 条 件 : 


import mysql.connector 

mydb = mysql.connector.connect( 
host="localhost", 

UsSeI—" Toot . 

passwd="", 

database="test" 

) 

mycursor = mydb.cursor() 

sql = "update books set author = %s Where author = %s" 
val = ("aaa", "bbb") 

Inycursor.execute(sql, val) 

mydb.commmt() 

print(mycursor.rowcount, ”条 记录 被 修改 "") 


执行 以 上 程序 ， 输 出 结果 如 下 : 


RESTART: D:/pyproject/updatess.py 
1 条 记录 被 修改 


12.4.12 ”删除 数据 表 


要 删除 数据 表 ， 可 以 使 用 drop table 语句 ，if exists 关键 字 用 于 判断 数据 表 是 否 存在 ， 仅 在 
存在 的 情况 下 才 删 除 。 例 如 ， 假 设 有 books_ copy 表 ， 要 将 该 表 删 除 ， 程 序 如 下 : 


ImDport mysql.connector 

mydb = mysql.connector.connect( 

host="localhost", 

USeI 一 Toat . 

passwWd=…”. 

database="test " 

) 

mycursor = mydb.cursor() 

sql= "drop table ifexists books_copy” # 删除 数据 表 books_copy 
mycursor.execute(sql) 
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执行 以 上 程序 ， 如 果 删 除 成 功 ， 不 会 有 任何 输出 。 


本 章 小 结 


数据 库 为 数据 的 存储 提供 了 一 种 方便 的 手段 。 可 以 使 用 一 些 附加 的 模块 编写 能 够 访问 所 有 
主流 数据 库 的 Python 脚本 。 本 章 提 供 了 关于 SQL 的 简短 介绍 ， 并 讨论 了 Python 的 DB API。 

你 还 了 解 了 各 种 dbm 模块 ， 它 们 人 允许 使 用 各 种 dbm 库 持 久 化 字典 。 这 些 模块 使 开发 人 员 
能 够 使 用 各 个 字典 并 透明 地 对 数据 进行 持久 化 。 

另外 ， 本 章 介 绍 了 Python 的 DB API， 它 们 定义 了 一 些 方法 和 函数 的 标准 集合 ， 所 有 的 数 
据 库 模块 都 应 该 提供 它们 。 要 点 如 下 : 


connection 对 象 封 装 了 到 数据 库 的 一 个 连接 。 使 用 数据 库 模 块 的 connect0 函 数 可 以 得 到 
一 个 新 的 连接 。 传 递 给 connect0 函 数 的 各 个 参数 可 能 会 因 各 个 模块 的 不 同 而 不 同 。 
游标 提供 了 用 于 与 数据 库 进 行 交 互 的 主要 对 象 。 使 用 connection 对 象 可 以 获得 一 个 游 
标 。 游 标 使 你 可 以 执行 一 些 SQL 语句 。 

可 以 将 动态 数据 作为 包含 若干 值 的 元 组 传递 给 游标 的 execute0 方 法 ,这些 值 被 放置 于 各 
个 SQL 语句 中 ， 从 而 允许 创建 一 些 可 重用 的 SQL 语句 。 

在 执行 查询 操作 之 后 ，cursor 对 象 对 数据 进行 保存 。 使 用 fetchone0 或 fetchall0 方 法 可 以 
提取 数据 。 

在 对 数据 库 进 行 修改 之 后 , 调用 connection 对 象 的 commit0 方 法 以 提交 事务 并 保存 更 改 。 
使 用 rollback0 方 法 可 以 撤销 更 改 。 

当 操 作 完 毕 后 ， 调 用 每 个 游标 的 close0 方 法 。 当 不 需要 连接 时 ， 调 用 connection 对 象 的 
close0 方 法 。 

Python 的 DB API 定义 了 一 个 异常 的 集合 。 Python 脚本 应 该 对 这 些 异常 进行 检查 ,以 处 
理 可 能 出 现 的 各 种 问题 。 


通过 本 章 的 学 习 ， 大 家 应 熟练 掌握 Python 编程 中 针对 数据 库 、 数 据 表 、 记 录 、 字 段 的 各 


种 操作 。 


思考 和 练习 


假设 有 一 个 数据 库 ， 包 括 四 个 表 : 学 生 表 (Student)、 课 程 表 (Course)、 成 绩 表 (Score) 以 及 教 


师 信息 表 (Teacher)。 四 个 表 的 结构 分 别 如 表 12-9~ 表 12-12 所 示 ， 用 SQL 语句 创建 这 四 个 表 并 
完成 相关 题目 。 
起 12-9 一 
字段 名 CE 
sno aa 学 号 (主键 
sname chal8) | 否 | 学 生 姓 名 
ssex aa | 否 | 学 生性 别 
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字段 名 
sbirthday 


class 


字段 名 
cno 
cname 


tno 


字段 名 
sno 
cno 
deeree 


联合 主键 Snot+Cno 


字段 名 
tho 
tname 
tsex 
tblirthdan 
rof 


depart 


0 =] = 


‘DO 


( 续 表 ) 


数据 类 型 含义 
Er 学 生出 生年 月 


al WwW 学 生 所 在 班级 


本 12-10 二 一 一 
含义 
课程 号 ( 主 铺 
课程 名 条 
教工 编号 0 外 锦 


表 12-11 Score( 成 绩 表 ) 
数据 类 型 
haG) | 百 | 学 30 怨 


aa | | 染 E50 忽 


decimal(4.1) 可 | 山 


要 1 1212 er 


含义 
char 教工 编号 ( 主 鳃 
char(4) 否 教工 姓名 
char(2) 个 教工 性 别 


教工 出 生年 月 
dO | | 枉 
jada) | 下 | 教 Hi 训 | 


到 | 到 | 到 


. 查询 Student 表 中 所 有 记录 的 sname、ssex 和 class 列 。 

. 查询 教师 所 在 的 部 门 ， 即 不 重复 的 depart 列 。 

. 查询 Student 表 的 所 有 记录 。 

. 查询 Score 表 中 成 绩 在 60 和 80 之 则 的 所 有 记录 。 

. 查询 Score 表 中 成 绩 为 85、86 或 88 的 记录 。 

. 查询 Student 表 中 “95031” 班 或 性 别 为 “ 女 ” 的 学 生 记 录 。 

.以 class 字段 降序 查询 Student 表 的 所 有 记录 。 

. 以 cno 升序 、degree 降序 查询 Score 表 的 所 有 记录 。 

. 查询 “95031” 班 的 学 生 人 数 。 

10. 查询 Score 表 中 最 高 分 的 学 生 学 号 和 课程 号 (使 用 子 得 询 或 排序 )。 


11. 查询 每 门 课 的 平均 成 绩 。 
12. 查询 Score 表 中 至 少 有 $ 名 学 生 选 修 并 以 3 开头 的 课程 的 平均 分 。 
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13. 查询 分 数 大 于 70 且 小 于 90 的 sno 列 。 

14. 查询 所 有 学 生 的 sname、cno 和 degree 列 。 
15. 查询 有 所 有 学 生 的 sno、cname 和 degree 列 。 
16. 查询 所 有 学 生 的 sname、cname 和 degree 列 。 
17. 查询 “95033” 班 学 生 的 平均 分 。 

18. 假设 使 用 如 下 命令 建立 了 Grade 表 : 

create table grade(low mt(3).upp mt(3).rank char(1)) 
insert into erade values(90,100,'A.) 

insert into grade values(80.89., "B') 

Insert Into erade Values(70.79.C) 

Insert Into erade Values(60.69. D ) 

insert into grade values(0.59, 'E') 


查询 所 有 学 生 的 sno、cno 和 Tank 列 。 
19. 查询 选修 “3-105” 课 程 且 成 绩 高 于 “109” 号 学 生成 绩 的 所 有 学 生 记 录 。 
20. 查询 Score 表 中 选 学 多 门 课程 的 学 生 中 分 数 为 非 最 高 分 的 记录 。 
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自从 网 络 诞生 后 , 无论 是 软件 开发 还 是 Web 开发 ， 都 离 不 了 网 络 编程 技术 。 这 和 互联 网 应 
用 是 相关 的 。 互 联网 的 所 有 应 用 中 ， 有 两 类 应 用 使 用 得 最 广 : 一 类 是 Web 应 用 ， 主 要 作为 资源 
提供 者 ， 供 浏览 者 访问 ; 男 一 类 是 电子 邮件 ， 用 来 取代 传统 的 邮件 ， 成 为 商务 办 公交 流 的 主要 
途 笃 之 一 3 

网 络 通 信和 就 是 两 个 进程 在 通信 。 网 络 编程 对 所 有 开发 语言 都 是 一 样 的 ，Python 也 不 例外 。 
用 Python 进行 网 络 编程 ， 就 是 在 Python 程序 本 身 这 个 进程 内 ， 连 接 其 他 服务 器 进程 的 通信 端 
口 进 行 通 信 。 

作为 一 门 主流 语言 ，Python 在 网 络 编程 方面 有 过 人 之 处 ， 是 十 分 强大 的 网 络 编程 工具 。 
Python 提供 了 许多 针对 常见 网 络 协 议 的 库 , 这 些 库 可 以 使 开发 人 员 集 中 精力 于 程序 的 逻辑 处 理 ， 
而 不 是 停留 在 网 络 实现 的 细节 中 。 使 用 Python 很 容易 写 出 处 理 各 种 协议 格式 的 代码 ，Python 
在 处 理 字 节 流 的 各 种 模式 方面 很 擅长 。 本 章 主 要 介绍 Python 网 络 编程 技术 。 


本 草 的 学 习 目 标 : 

网 络 编程 概述 ; 

如 何 使 用 Python 标准 库 编写 可 以 创建 、 发 送 以 及 接收 电子 邮件 的 应 用 程序 ; 
如 何 使 用 Python 编写 接收 Ptemet 邮件 的 客户 病 ; 

套 接 字 编程 。 


目 从 互联 网 诞生 以 来 ， 基 本 上 上 有 程序 都 是 网 络 程序 ， 很 少 有 单机 版 程序 了 。 

计算 机 网 络 把 各 人 台 计 算 机 连接 到 一 起 ， 让 网 络 中 的 计算 机 可 以 互相 通信 。 网 络 编程 在 程序 
中 实现 了 两 台 计 算 机 的 通信 。 比 如 ， 妆 用 户 使 用 浏 贤 占 访问 淘宝 网 时 ， 用 户 计算 机 和 淘宝 网 的 
东台 服务 右 通 过 互联 网 连接 起 来 了 ， 淘 宇 网 的 服务 砷 束 会 把 网 页 内 容 作为 数据 通过 互联 网 传输 
到 用 户 计 算 机 上 。 

用 户 计 算 机 上 可 能 不 止 安装 了 浏览 副 ， 还 有 微 信 、 办 公 软 件 、 邮 件 客户 端 等 ， 不 同 程序 连 
接 的 服务 占 也 会 不 同 。 因 此 ， 网 络 通信 和 是 两 台 计 算 机 的 两 个 进程 之 间 的 通信 。 例 如 ， 浏 览 器 进 


Python 茎 础 教程 ~ 


程 和 淘宝 网 服务 器 上 的 某 个 Web 服务 进程 通信 ， 而 微 信 进 程 和 腾讯 服务 右上 的 某 个 进程 通信 。 
网 络 编程 用 任何 开发 语言 来 实现 都 是 一 样 的 , Python 语言 也 不 例外 。 用 Python 语言 进行 网 
络 编程 ， 就 是 在 Python 程序 本 喘 这 个 进程 内 ， 连 接 别 的 服务 匿 进程 的 通信 端口 以 进行 通信 。 


TCP/IP 简介 


互联 网 协议 族 (Intemet Protocol Suite, IPS) 是 一 种 网 络 通信 模型 , 是 互联 网 的 基础 通信 架构， 
常 被 称 为 TCP/IP 协议 族 (TCP/IP Protocol Suite 或 TCP/IP Protocols)， 简 称 TCP/IP。 
13.2.1 TCPIIP 协议 族 概述 

TCP/P 提供 点 对 点 的 链接 机 制 ， 将 通信 过 程 中 数据 应 该 如 何 封装 、 定 址 、 传 输 、 路 由 以 及 
在 目的 地 如 何 接 收 ， 都 加 以 标准 化 。 它 通 第 将 软件 通信 过 程 抽 象 为 四 个 层次 ， 如 图 13-1 所 示 ， 
TCP/IP 采取 协议 堆栈 的 方式 ， 分 别 定 义 了 不 同 的 通信 协议 。 


网 络 接口 


图 13-1 _TCP/ 正 协议 族 


13.2.2 ”应 用 层 


1. Telnet 


Telnet 常用 于 服务 器 远程 控制 ， 它 使 用 虚拟 终端 机 的 形式 ， 提 供 以 字符 串 命令 为 主 的 双向 
交互 功能 。 由 于 传统 的 Telnet 会 话 数据 没有 加 密 ， 目 前 很 多 服务 器 都 改 用 更 安全 的 SSH。 需 要 
注意 的 是 , SSH(Secure Shel) 是 一 种 加 密 的 网 络 传输 协议 , 通过 创建 安全 隧道 来 实现 客户 端 与 服 
务 器 的 连接 ， 常 用 于 远程 登录 系统 . 


FTP(File Transfer Protocol， 文 件 传 输 协 议 ) 是 一 种 8 位 的 客户 端 -服务 器 协议 , FTP 服务 一 般 
运行 在 20 与 21 端口 。 其 中 ，20 痛 口 用 于 传输 数据 流 ，21 端口 用 于 传输 控制 流 。FTP 的 缺点 是 
有 极 高 的 延 时 。 

运行 FTP 服务 的 许多 站 点 都 开放 匿名 服务 ， 在 这 种 设置 下 ， 用 户 不 需要 账号 就 可 以 登录 服 
务 器 ， 默 认 情况 下 ， 匿 名 用 户 的 用 户 名 是 anonymous。 这 个 账号 不 需要 密码 ， 虽 然 通 常 要 求 输 
和信 用户 的 邮件 地 址 作为 认证 密码 ， 但 这 只 是 一 些 细节 或 者 邮件 地 址 根本 不 被 确定 ， 而 是 依赖 于 
FTP 服务 的 配置 情况 。 
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3. SMTP 


SMTP(Simple Mail Transfer Protocol， 简 单 邮件 传输 协议 ) 指 定 消 息 的 接收 者 (被 确认 存在 )， 
传输 消 轧 文本 。 使 用 的 TCP 端口 为 25。 

SMTP 是 一 种 “ 推 ”协议 , 不 文 持 从 远程 服务 器 “ 拉 取 ”数据 ,要 拉 取 数据 ,需要 使 用 POP3 
或 IMAP 协议 。 


4. HTITP 


HTTP(HyperText Transfer Protocol， 超 文本 传输 协议 ) 的 当前 标准 版 本 为 HTTP/2。HTTP 协 
议 在 进行 通信 时 涉及 URL( 统 一 资源 标识 人 符 ) 的 概念 ， 用 于 标识 通过 HTTP、HTTPS 协议 请 求 的 
资源 。 

在 使 用 HITP 协议 进行 通信 时 ， 客 户 端 (用 户 代 理 程序 ) 的 请 求 通常 被 发 送 到 服务 器 ( 源 服务 
器 ) 的 80 端口 , HTTP 可 以 在 任何 互联 网 上 实现 , 它 假定 下 层 协议 提供 数据 传输 , 因此 在 TCP/IP 
协议 中 ， 使 用 TCP 作为 传输 层 。 

服务 器 收 到 HTTP 请 求 后 ， 会 返回 一 个 状态 码 ， 通 常 200 代表 “OK”。 

1) HTTP 的 请 求 方法 

HTTP 的 请 求 方法 中 至 少 需要 实现 GET 与 HEAD( 这 两 者 都 属于 安全 方法 ， 因 为 它们 只 用 
于 获取 资源 信息 ， 而 不 做 其 他 请 求 )， 其 他 方法 可 选 。HTTP 的 所 有 请 求 方法 如 表 13-1 所 示 。 


表 13-1 HTTP 的 所 有 请 求 方法 


请 求 方法 朱 述 
GET “显示 ”请 求 ， 只 用 于 读 取 数据 ，GET 可 被 网 络 爬 虫 等 随意 访问 
HEAD 请 求 资源 ， 但 不 传 回 文 本 部 分 ， 用 于 在 不 获取 资源 全 部 内 容 的 情况 下 提取 元 信息 
POST 上 传 表单 数据 等 ， 可 以 创建 或 修改 资源 
PUT 向 指 定位 置 传输 最 新 内 容 
DELETE 请 求 删 除 资 源 
TRACE 显示 服务 器 收 到 的 请 求 ， 通 常用 于 测试 


这 里 简单 介绍 一 下 不 同 的 请 求 方 法 发 出 的 请 求 头 。 

例如 ，GET 是 最 常用 的 一 种 请 求 方法 。 当 客户 端 要 从 服务 占 中 读 取 文档 时 ， 往 往 单 击 网 页 
上 的 链接 或 者 通过 在 浏览 器 的 地 址 栏 输入 网 址 来 浏览 网 员 ， 此 时 使 用 的 都 是 GET 方法 。 

GET 方法 要 求 服 务 器 将 URL 定位 的 资源 放 在 啊 应 报 文 的 数据 部 分 ， 回 送 给 客户 端 。 

使 用 GET 方法 时 ， 请 求 参 数 和 对 应 的 值 附加 在 URL 后 面 ， 利 用 一 个 问号 (“?”) 代 表 URL 
的 结尾 与 请 求 参 数 的 开始 ， 所 传递 参数 的 长 度 会 党 到 限制 。 

例如 ，/index?id=100&op=bind， 这 样 通过 GET 方法 传递 的 参数 直接 显示 在 地 址 中 。 以 使 用 
Google 搜索 domety 为 例 ，Request 报 文 如 下 : 

GET /search?hl=zh-CNé&source=hp&q—dometyé&aq-{&ogq= HTTP/].1 


Accept Image/alt, image/x-xbitmap, Imapge/peg. 1maege/pjpees, application/vnd.ms-excel, 
application/vnd.ms-powerpomt, application/msword., applicatiom/x-silverlieht, application/x-shockwave-flash, */* 


Referer <a href—"http://Wwww.eoogle.cn">http://Wwww.google.cny/</a> 

Accept-Laneuage: zh-cn 

Accept-Encodme: gzip. deflate 

User-Agent: Mozlla/4.0 (compatible: MSIE 6.0: WIndows NT $5.1:; SV1: .NET CLR 2.0.30727: TheWorld) 

Host: <a href—"http:/Wwww.google.cn"~>Wwww.google.cn/a> 

Connection: Keep-Alive 

Cookie: PREF=ID—80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=1261351909:LM=12615331917: 
S=ybYcq2wptef4V9g: 
NID=31=oll8d-IvgaEtSXLsaJmqslvhCspkvJIBoomlamNTSm8IZhRY YMftD2M4QMREcH1lsOIQv9u2htBW7DUEFWV 
h7pGaRUbORNHCJTU3 


可 以 看 到 ,使 用 GET 方法 的 请 求 一 般 不 包含 “请 求 内 容 ” 部 分 ， 请 求 数据 以 地 址 的 形式 表 
现在 请 求 行 中 。 地 址 链接 如 下 : 


<a href="http://www.google.cnm/search?hl=zh-CNé&source=hp&q—domety&agq={&oq—="> 
http://Wwww.eooele.cn/search?hl=zh-CNésource—hpé&q—dometyéag—={&ogq—</a> 


地 址 中 “3?” 之 后 的 部 分 就 是 通过 GET 发 送 的 请 求 数据 ， 在 浏览 器 的 地 址 栏 中 可 以 看 到 ， 
各 个 数据 之 间 用 “此 ”符号 隔 开 。 显 然 ， 这 种 方式 不 适合 传送 私密 数据 。 

另外 ， 由 于 不 同 的 浏览 器 对 地 址 的 字符 限制 也 有 所 不 同 ， 一 般 最 多 只 能 识别 1024 个 字符 ; 
因此 ， 如 果 需 要 传送 大 量 的 数据 时 ， 不 适合 使 用 GET 方法 。 

对 于 上 面 提 到 的 不 适合 使 用 GET 方法 的 情况 ,可 以 考虑 使 用 POST 方法 , 因为 POST 方法 
允许 客户 端 给 服务 器 提供 更 多 的 信息 。POST 方法 将 请 求 参 数 封装 在 HITP 请 求 数据 中 ， 以 名 
称 / 值 的 形式 出 现 ， 可 以 传输 大 量 数据 ，POST 方法 对 传送 的 数据 大 小 没有 限制 ， 而 且 也 不 会 显 
示 在 URL 中 。 还 以 搜索 domety 为 例 ， 如 果 使 用 POST 方法 的 话 ， 格 式 如 下 : 


POST /search HITP/1.1 

Accept Image/alt, 1mDnape/X-xXbltmap. Imape/peg. 1mage/pjpee, applicationVvndIms-excel 
application/vnd.ms-powerpomt, application/msword, applicatiom/x-silverlieht, application/x-shockwave-flash., */* 

Reterer: <a href—"http://www.google.cn/">http//Wwww.google.cny/</a> 

Accept-Laneuage: zh-cn 

Accept-Encodme: gzip, deflate 

User-Agent: Mozlla/4.0 (compatible: MSIE 6.0: WIndows NT $.1:; SV1: .NET CLR 2.0.30727: TheWorld) 

Host <a href—"http:/Wwww.google.cn">www.google.cn</a> 

Connection: Keep-Alive 

Cookie: PREF=ID=80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=12615351909:LM=12615531917: 
S=ybYcq2wpftef4V9g: 
NID=31=oll8d-IvsgaEtSxXLgaJmqsl]vVhcCspkvUJrB6omlamNrsm8lZhKRY yMI{O2MAQMRKcH]1g01Qv902hfBWT7bUFwWV 
h7pGaRUb0ORnHcJU37y-FxXlRugatxg63JLV7CWMD6OUB Or 

hl=zh-CNésource=hp&q—=domety 


可 以 看 到 ，POST 请 求 行 中 不 包含 数据 字符 串 ， 这 些 数据 保存 在 “请 求 内 容 ” 部 分 ， 各 数 
据 之 间 也 使 用 “&” 符 号 阳 开 。 

POST 方法 大 多 用 于 页 面 的 表单 。 因 为 POST 也 能 完成 GET 的 功能 ， 所 以 多 数 人 在 设计 表 
单 的 时 候 一 律 都 使 用 POST 方法 ， 其 实 这 是 误区 。 
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GET 方法 也 有 目 己 的 特点 和 优势 ， 应 该 根据 不 同 的 情况 选择 是 使 用 GET 还 是 使 用 POST。 

2) HTTP/1.0 与 HTTP/1.1 的 区 别 

HTTP/1.0 在 代理 服务 中 仍 被 广泛 使 用 。HTTP/1.1 引入 了 持续 连接 机 制 ， 此 前 TCP 连接 在 
每 次 请 求 /回应 后 关闭 ， 多 次 运行 TCP 交 握 程序 会 延长 等 待 时 间 。HTTP/1.1 文 持 在 应 答 前 持续 
发 送 请 求 (通常 为 两 个 )， 称 为 “ 流 线 化 ”。 

HTTP/1.1 与 HTTP/1.0 的 区 别 在 于 : 缓存 处 理 ; 带宽 优化 以 及 网 络 连 接 的 使 用 ， 默 认 使 用 
持久 连接 ， 通 过 引入 分 块 传输 编码 、 管 道 等 改进 融 宽 、 清 后 感 ， 错误 通知 的 管理 ; 消息 在 网 络 
中 的 上 发送， 互联 网 地 址 的 维护 ， 安 全 性 与 完整 性 。 

3) 状态 三 

使 用 HTTP 协议 进行 通信 的 过 程 中 ， 不 同 的 啊 应 有 不 同 的 状态 码 ， 和 常见 的 状态 码 有 : 

e 1XX， 以 1 开头 的 状态 码 表示 消息 请 求 已 被 服务 器 接收 ， 继 续 处 理 ; 
2XX， 以 2 开头 的 状态 码 表 示 请 求 成 功 ， 请 求 己 被 服务 器 成 功 接收 、 理 解 ; 
3XX， 以 3 开头 的 状态 码 表示 重 定向 ， 请 求 仍 需要 后 续 操作 ; 
4XX， 以 4 开头 的 状态 码 表示 请 求 错 误 、 词 法 错误 或 者 无 法 执行 ; 
5$XX， 以 5 开头 的 状态 码 表示 服务 器 错误 ， 在 处 理 某 个 正确 请 求 时 ， 服 务 器 发 生 错误 。 

其 中 ，404 表示 请 求 的 资源 不 存在 ; 405 表示 资源 不 支持 请 求 方法 501 表示 服务 器 不 文 持 
请 求 方法 ，505 表示 服务 器 程序 错误 。 

需要 注意 的 是 ， 请 求 行 和 标题 必须 以 <CR><LF> 结 尾 。 空 行内 必须 只 有 <CR><LF> 而 无 其 
他 空格 。 在 HTTP/1.1 协议 中 ， 所 有 的 请 求 头 ， 除 Host 外 ， 都 是 可 选 的 。 

4) DNS 

DNS 是 提供 域名 与 他 地 址 的 相互 映射 的 数据 库 。 通 第 使 用 TCP 与 UDP 的 端口 S3， 域 名 
的 总 长 度 不 能 超过 253 个 字符 ， 每 一 级 域名 的 长 度 不 能 超过 63 个 字符 。 

DNS 查询 有 两 种 方法 : 一 种 是 递归 ，DNS 客户 端 常 用 的 一 般 是 递归 查询 方式 ; 另 一 种 是 
迭代 ，DNS 服务 器 间 通 党 采用 人 迭代 得 询 方式 。 


13.2.3 ”传输 层 


1 TeP 


TCP(Transmission Control Protocol， 传 输 控 制 协议 ) 是 一 种 基于 字 节 流 的 传输 层 通信 协议 。 

应 用 层 同 TCP 层 发 送 用 于 网 间 传 输 的 、 用 8 位 字 节 表示 的 数据 流 ， 然 后 TCP 把 数据 流 分 
成 适当 长 度 的 报 文 段 . 报 文 长 度 通 常 受 计算 机 所 连接 网 络 的 数据 链 路 层 的 最 大 传输 单元 的 限制 |。 
之 后 TCP 把 结果 包 传 给 外 层 。IP 层 提 供 不 可 靠 的 包 交 换 。 

TCP 为 了 保证 不 发 生 丢 包 ， 就 给 每 个 包 设 定 一 个 序号 。 序 号 保证 了 传送 到 接收 端 实 体 的 包 
按 序 接 收 。 接 收 问 实体 会 对 已 成 功 收 到 的 包 发 回 相应 的 确认 信号 (ACK); 如 果 发 送 端 实体 在 合 
理 的 往返 时 延 (RTT) 内 未 收 到 确认 信和 号， 那么 对 应 的 数据 包 就 被 假设 为 已 丢失 并 重 传 。 


2. TCP 创建 连接 的 过 程 
TCP 创建 连接 (三 次 握手 ) 的 过 程 如 图 13-2 所 示 。 客 户 端 通 发 送 SYN 包 并 且 把 这 段 连接 的 
序号 设 定 为 随机 数 A; 服务 器 端 为 合理 的 SYN 包 返 回 SYN/ACK 包 ，ACK 的 确认 码 为 A+l， 
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同时 SYN/ACK 包 本 身 又 带 有 随机 产生 的 序号 B; 客户 端 收 到 SYN/ACK 包 后 再 次 发 送 ACK， 
服务 器 收 到 该 ACK 后 ， 连 接 就 建立 了 。 

此 时 ， 包 的 序号 为 A+1， 啊 应 号 为 B+1。 

在 Linux 中 ， 和 大 没有 收 到 最 后 的 ACK， 服 务 器 会 重复 发 送 SYN/ACK 包 ( 默 认 发 送 五 次 )。 
经 过 一 定时 间 后 知 无 回应 ， 就 会 断 开 连接 。 


服务 器 被 动 打开 〈bind) 
| 


外 
J 


S 
SS 
SYN-ACK 包 
J 


ey 


图 13-2 TCP 创建 连接 的 过 程 


TCP 传输 是 可 靠 的 ， 发 送 与 接收 时 包 都 有 序号 ， 通 过 接收 方 返 回 的 ACK 可 以 确认 对 方 已 
经 接收 的 数据 字 节 人 位置。 发送 方 通过 检测 丢失 的 传输 数据 并 且 重 新 传输 它们 ， 确 保 了 数据 传输 
的 可 靠 性 。 

另外 ，TCP 传输 还 有 超时 重 传 、 校 验 和 (16 位 ) 机 制 。TCP 校 验 和 包括 96 位 的 伪 头 部 ， 其 
中 有 源 地 址 、 目 的 地 址 、 协 议 以 及 TCP 的 长 度 。 TCP 的 实现 包含 4 种 相互 影响 的 拥塞 控制 算法 ， 
分 别 是 慢 开 始 、 拥 塞 避 免 、 快 重 传 、 快 恢复 。 

TCP 还 允许 接收 方 确认 成 功 收 到 的 分 组 的 不 连续 块 。 当 需要 终止 连接 时 ， 需 要 经 过 四 次 握 
手 ( 这 里 不 再 对 终止 连接 的 四 次 握手 进行 介绍 ， 感 兴趣 的 读者 可 以 阅读 其 他 相关 资料 )。 


3. UDP 


UDP(User Datagram Protocol， 用 户 数 据 报 协 议 ) 是 不 可 徘 的 数据 传输 协议 ， 因 为 UDP 不 需 
要 应 答 ， 所 以 来 源 端 口 可 选 。 由 于 缺乏 可 靠 性 且 属 于 非 连接 导 回 协议 ，UDP 应 用 一 般 必 须 允 许 
一 定量 的 丢 包 、 出 错 和 复制 /粘贴 。 流 媒体 是 典型 的 UDP 应 用 。 


13.2.4 ”网 络 技 


1. 1P 


IP(Internet Protocol， 网 际 协议 ) 用 于 分 组 交换 数据 。 卫 协议 的 第 一 个 版 本 是 IPv4， 目前 仍 在 
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使 用 ， 尽 管 目 前 世界 各 地 正在 积极 部 署 [Pv6。IPv4 有 32 位 地 址 ，IPv6 有 128 位 地 址 。 

数据 在 使 用 人 P 协议 传送 时 ， 被 封装 为 数据 报 文 : 数据 包 = 头 (控制 信息 )+ 负 载 (信息 数据 )。 
IP 协议 是 一 种 “ 尽 最 大 努力 交付 ”的 数据 包 传 输 机 制 。 

将 王 地 址 解析 为 相应 的 数据 链 路 地 址 的 方法 : IPv4( 地 址 解析 协议 ARP)、IPv6( 邻 居 发 现 协 
议 NDP)。 

IP 网 际 协 议 提供 的 唯一 帮助 是 ，IPv4 规定 通过 在 路 由 节点 计算 校 验 和 来 确保 卫 数据 报头 
是 正确 的 ， 这 带 来 的 不 良 后 果 是 当场 丢弃 报头 错误 的 数据 报 文 。 这 种 情况 下 不 需要 发 送 通知 给 
任何 终端 节点 ， 但 是 互联 网 控制 消息 协议 ICMP) 中 存在 一 种 机 制 可 以 做 到 这 一 点 。IPv6 为 了 快 
速 传输 已 经 放弃 计算 校 验 和 。 


2. ICMP 


互联 网 控制 消息 协议 ICMP) 常 用 于 在 TCP/IP 网 络 中 发 送 控制 消息 。ICMP 是 正 的 主要 部 
分 ，ICMP 属于 不 可 靠 协 议 。 


3. ARP 

ARP 通过 解析 网 络 层 地 址 来 寻找 数据 链 路 层 地 址 , 即 通过 网 络 地址 (例如 卫 v4) 来 定位 MAC 
地 址 。 

在 以 太 网 中 使 用 下 协议 时 ， 因 为 在 以 太 网 与 上 层 卫 协议 中 ， 只 含有 卫 地 址 信息 ， 所 以 需 
要 ARP 协议 根据 主机 的 卫 地 址 找到 其 MAC 地 址 ， 这 就 是 地 址 解析 。 

4. RARP 

逆 地 址 解析 协议 RARP 用 于 将 MAC 地 址 转换 为 中 地 址 。 

13.2.5 ”IP 地 址 与 端口 

这 里 介绍 的 他 地址 并 不 等 同 于 前 面 介绍 的 四 协议。 

1. Internet 地 址 

Itemet( 或 者 私有 的 TCP/IP 网 络 ) 上 的 每 台 计 算 机 都 有 一 个 或 多 个 卫 地 址 ， 通 常 表示 为 一 
个 用 句点 分 开 的 含 4 个 数值 的 序列 ， 如 “208.215.179.178”。 同 一 台 计 算 机 也 许 有 多 个 类 似 
“wrox.com” 这样 的 主机 各。 

为 了 连接 到 某 台 计算 机 上 运行 的 服务 ， 需 要 知道 这 台 计 算 机 的 卫 地 址 或 主机 名 (主机 名 由 
DNS 管理 。DNS 是 运行 在 TCP/TP 协议 之 上 的 协议 ， 它 自动 将 主机 名 转换 为 卫 地 址 )。 例 如 以 
下 发 送 电 子 邮 件 的 脚本 ， 当 它 尝试 连接 到 邮件 服务 器 时 ， 用 到 了 字符 串 localhost: 

>>> seIver = smtplib.SMTP("localhost", 25) 

其 中 ，localhost 是 特殊 的 主机 和 名， 在 引用 它 时 ， 它 指向 用 户 正 在 使 用 的 计算 机 (每 台 计算 机 
都 有 一 个 特殊 的 卫 地 址 指向 自己 : 127.0.0.1)。 主机 名 告诉 Python 在 Intemet 上 的 什么 位 置 寻找 
邮件 服务 器 。 

当然 ， 如 果 计 算 机 上 没有 运行 邮件 服务 器 ，localhost 将 不 能 工作 。 提 供 Intermet 访问 的 组 织 
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应 该 会 允许 用 户 使 用 它 的 邮件 服务 器 ， 可 能 位 于 mail[ 你 的 ISPl].com 或 smtp.[ 你 的 IJSP].com。 
不 论 使 用 什么 样 的 邮件 客户 端 ， 配 置 中 的 条 处 会 有 邮件 服务 器 的 主机 名 ， 因 此 可 以 用 它 发 送 电 
子 邮 件 。 使 用 邮件 服务 器 的 主机 名 蔡 换 前 面 示例 代码 中 的 localhost 后 , 应 当 可 以 在 Python 中 发 

>>> fromAddress = 'Sender(example.com 

>>> toAddress = 和 [你 的 电子 邮箱 地 址 ] 

>>> msg = 二 "邮件 正文 内 容 " 

>>> import smtplib 

>>> seIver = sintplib.SMTP("“mail.[your ISP].com", 25) 

>>> server.sendmail(fromAddress, toAddress, mse) 


2. 网 络 接 口 


字符 串 localhost 被 解释 为 掩盖 他 地 址 的 DNS 主机 名 。 现 在 只 剩 下 神秘 的 数字 25。 这 意味 
着 什么 ? 考虑 这 样 一 个 事实 : 一 台 计 算 机 可 能 托管 多 个 服务 。 拥 有 一 个 卫 地址 的 计算 机 可 能 拥 
有 Web 服务 器 、 邮 件 服务 器 、 数 据 库 服务 器 和 其 他 一 些 服务 器 。 客 户 端 如 何 区 分 到 不 同 服务 器 
的 连接 ? 例如 到 Web 服务 器 的 连接 和 到 数据 库 服 务 器 的 连接 。 

实现 Intemet 协议 的 计算 机 有 65 536 个 己 编 号 的 端口 。 当 局 动 mtemet 服务 器 (比如 Web 服 
务 顺 ) 时 ， 服 务 髓 进程 将 自己 “ 绑 定 ”到 计算 机 的 一 个 或 多 个 端口 (例如 端口 80， 这 是 Web 服务 
器 的 币 规 端口 ), 并 且 开 始 监听 访问 口 的 外 部 连接 ， 比 如 http:/Wwww. example.com:8000 这 样 的 网 
络 地 址 ， 数 字 8000 是 Web 服务 器 的 端口 号 。 

SMTP 服务 器 的 常规 端口 号 为 25。 所 以 ， 前 例 中 SMTP 对 象 的 构造 函数 接收 25 作为 第 二 
个 参数 (如 果 没 有 指定 任何 端口 号 ，SMTP 对 象 的 构造 函数 将 默认 端口 号 为 25): 


>>> server = smtplib.SMTP("localhost". 25) 


IANA 将 端口 划分 为 * 公 开端 口 ”( 端 口号 为 0 一 1023)、“ 注 册 端 口 ”( 端 口号 为 1024 一 49 151) 
和 “动态 端口 ”( 端 口号 为 49 1$2 一 65 535)。 在 大 多 数 操作 系统 上 ， 必 须 有 管理 员 权 限 才 能 将 服 
务 器 绑 定 到 公开 端口 ， 因 为 绑 定 到 那些 端口 的 进程 通 溃 有 管理 员 权 限 。 


发 送 电子 邮件 


SMTP 是 邮件 发 送 协议 ，Pvthon 内 置 对 SMTP 的 支持 ， 可 以 发 送 纯 文本 邮件 、HTML 邮件 
以 及 带 附件 的 邮件 。Python 通过 smtplib 和 email 两 个 模块 来 支持 SMTP。 其 中 ，email 模块 负 
责 构造 邮件 ，smtplib 模块 负责 发 送 邮 件 。 


13.3.1 ”Python 发 送 邮 件 


SMTP 是 一 组 用 于 从 源 地 址 传送 邮件 到 目的 地 址 的 规则 , 用 来 控制 信件 的 中 转 方式 . Python 
的 smtplib 模块 提供 了 方便 的 途径 以 发 送 电 子 邮件 ， 该 模块 对 SMTP 协议 进行 了 简单 的 封装 。 
Python 中 创建 SMTP 对 象 的 语法 格式 如 下 : 
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import smtplib 

smtpOb] = smtplib.SMTP( [host [, port [, local hostname||| ) 

其 中 各 项 参数 的 含义 如 下 。 

e host: 可 选 参 数 , 表示 SMTP 服务 器 主机 。 可 以 指定 主机 的 卫 地址 或 域名 ,比如 163.com。 

e port: 如 果 提 供 了 host 参数 ， 需 要 指定 SMTP 服务 器 使 用 的 端口 号 ， 默 认为 25。 

e local hostname: 如 果 SMTP 服务 器 在 本 地 计算 机 上 , 只 需要 指定 服务 器 地 址 为 localhost 
即 可 。 

SMTP 对 象 使 用 sendmail0 方 法 发 送 邮件 ， 语 法 格式 如 下 : 


SMTP.sendmail(fiom addr to addrs, msg[. mail options, Tcpt options]) 


其 中 ， 各 项 参数 的 含义 如 下 。 

e from addr: 邮件 发 送 者 的 地 址 。 

e to addrs: 字符 串 列 表 ， 邮 件 发 送 的 目标 地 址 。 

Ss INSp: 邮件 内 容 。 

这 里 需要 注意 一 下 第 三 个 参数 ，msg 是 字符 串 ， 表 示 邮 件 内容 。 众 所 周知 ， 邮 件 一 般 由 标 
题 、 发 信人 、 收 件 人 、 邮 件 内 容 、 附 件 等 构成 ， 发 送 邮 件 的 时 候 ， 要 注意 msg 的 格式 ， 这 就 是 
SMTP 协议 中 定义 的 格式 。 

以 下 是 一 个 使 用 Python 发 送 邮 件 的 简单 示例 。 


#1/usr/bin/python3 


1mport smtplib 
from email.mime.text 1mport MIME Text 
from emalil.header mport Header 


sender = buaalandy(?163.com 
receivers = [1005002008@qq.com] # 接收 邮件 ， 可 设置 为 QQ 邮箱 或 其 他 邮箱 


# 三 个 参数 ， 第 一 个 参数 为 文本 内 容 ， 第 二 个 参数 设置 文本 格式 ， 第 三 个 参数 设置 编码 方式 
message 二 MTIMEText(Python 邮件 发 送 测试 … Plain' utf-8) 

message['From'] = Header("loneledine", ‘utf-8") # 发 送 者 

message[To]= Header(" 测 试 邮件 "utf8) # 接收 者 


subject='SMTP 邮件 测试 
Diessapgel'Sublect|= Header(subject, "utf-8") 


try: 
smtpOb] = smtplib.SMTP(localhost) 
sintpObl.sendmail(sender. receIvers. message.as strine()) 
print(" 邮 件 发 送 成 功 ") 

except smtplib.SMTPException: 
print("Error: 无 法 发 送 邮 件 ") 
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这 里 使 用 3 对 单 引 号 来 设置 邮件 信息 ， 标 准 邮件 需要 三 个 头 部 信息 : From、To 和 Subject， 
每 部 分 使 用 空 行 分 隔 。 

可 通过 实例 化 smtplib 模块 的 SMTP 对 象 smtpObj 来 连接 到 SMTP 服务 ， 并 使 用 sendmailO 
方法 发 送信 息 。 

执行 以 上 程序 ， 如 果 本 机 安装 了 sendmailpy， 就 会 输出 如 下 信息 : 

$ python3 sendmail py 

邮件 发 送 成 功 


打开 收 件 箱 ， 融 可 以 查看 接收 到 的 邮件 信息 。 

如 果 本 地 计算 机 没有 提供 sendmail 访问 ， 也 可 以 使 用 其 他 服务 商 (QQ、 网 易 、Google 等 ) 
的 SMTP 服务 。 示 例 程 序 如 下 : 

#1l/usr/bm/python3 

import smtplib 


from email.mme.text import MIME Text 
from email.header mport Header 


# 第 三 方 SMTP 服务 
mail host="smtp.XXX.com'"  # 设 置 服务 器 


mail user="XXXX" # 用 户 名 
mall pass—"XXXXXX" # 口 令 


sender = 'from((2163.com' 


receivers 二 ['1005002008(@qq.com'] # 接收 邮件 ， 可 设置 为 QQ 邮箱 或 其 他 邮箱 


message 二 MIMEText( 邮 件 发 送 测 试 ……** , Plain', "utf-8") 
message[ From | = Header("buaalandy". "utf-8") 
message['To'] = Header(" 测 试 邮件 ", "utf-8") 


subject= "Python SMTP 邮件 测试 
message['Subject | = Header(subject, 'atf-8") 


try: 
smtpOb] = smtplib.SMTP() 
smtpObij.connect(mail host 25) ”#25 为 SMTP 亲口 号 
smtpObl.logIm(mall user.mail pass) 
sintpObl.sendmail(sender. recelIvers. message.as strine()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException: 
print ("Eror: 无 法 发 送 邮 件 ") 


13.3.2 Python 发 送 HTML 格式 的 邮件 
Python 发 送 HTML 格式 的 邮件 与 发 送 纯 文 本 消息 的 邮件 相 比 , 不 同 之 处 在 于 将 MIMEText 
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中 的 subtype 设置 为 hbtml'。 且 体 代 码 如 下 : 


#1/ust/bin/python3 


import smtplib 
from email.mme.text import MIME Text 
from emallheader mport Header 


sender = Duaalandy 人 外 163.com 
receivers = [1005002008@qq.com] # 接收 邮件 ， 可 设置 为 QQ 邮箱 或 其 他 邮箱 


mall msg=""" 

<p>Python 邮件 发 送 测试 ……</p> 

<p><a hre 伍 "http;//www.lonegleding.com"> 这 是 一 个 链接 </a></p> 
message = MIMEText(mall mseg, html ‘utf-8") 

message[ From | = Header("buaalandy". ‘utf-8") 

message[To]= Header(" 测 试 邮件 ", "utf-8") 


subject =='Python SMTP 邮件 测试 
message['Subject | = Header(subject, "utf-8") 


try: 
smtpOb] = smtplib.SMTP( localhost) 
smtpOb].sendmail(sender, receIvers, message.as strine()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException: 
print ("Error: 无 法 发 送 邮 件 ") 


执行 以 上 程序 ， 如 果 本 机 安装 了 sendmailpy， 输 出 结果 如 下 : 


$ python3 sendhtml.py 
邮件 发 送 成 功 


这 时 打开 收 件 箱 ， 就 可 以 查看 到 邮件 信息 。 
13.3.3 “Python 发 送 和 市 附件 的 邮件 


为 了 发 送 带 附件 的 邮件 ， 首 先 要 创建 MIMEMultipart0 实 例 ， 然 后 构造 附件 ， 如 果 有 多 个 附 
#1/usr/bm/python3 

import smtplib 

from email.mme.text import MIME Text 


from emall.mumne.multpart 1mport MIMEMujbpart 
from emallheader Import Header 


| 


sender 三 Duaalandy 必 163.com 
receivers 二 [1005002008(@qq.com'] # 接收 邮件 ， 可 设置 为 QQ 邮箱 或 其 他 邮箱 


# 创 建 一 个 融 附 件 的 实例 

message = MIMENMuItpartO) 

message[ From'] = Header("buaalandy" utf-8") 
message[To]= Header(" 测 试 邮 件 " "htf-8") 
subject= "Python SMTP 邮件 测试 
message['Subject | = Header(subject, ut-8 ) 


# 邮 件 正 文 内 容 
message.attach(MIMEText( 这 是 一 个 Python 邮件 发 送 测试 ……, plaim "utf-8")) 


# 构造 附件 1， 传 送 当前 目录 下 的 testtxt 文件 

attl = MIMEText(open('test.txt', Tb').read(), ‘base64', ‘utf-8") 
attl["Content-Type"| = "application/octet-stream 

# 这 里 的 fename 可 以 任意 写 ， 写 什么 名 字 ， 邮 件 中 就 显示 什么 名 字 
attl["Content-Disposition"| = 'attachment: fllename="test.txt" 
imessape.attach(attl) 


# 构造 附件 2， 传送 当前 目录 下 的 runoob.txt 文件 

att2 = MIMEText(open( runoob.txt', Tb').read(), ‘base64', ‘utf-8") 
att2["Content-Type"| = "application/octet-stream 
att2["Content-Disposition"| = 'attachment: filename="demo.txt"™ 
message.attach(att2) 


try: 
smtpOb] = smtplib.SMTIP(localhost') 
smtpOb].sendmail(sender, receIvers, message.as strine()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException: 
print ("Error: 无 法 发 送 邮 件 ") 


执行 程序 , 若 邮 件 发 送 成 功 , 则 可 以 在 收 件 箱 中 查看 到 邮件 , 邮件 中 附带 有 两 个 附件 test.txt 
和 demo.txt。 
13.3.4 在 HTML 文本 中 添加 图 片 

在 邮件 的 HTML 文本 中 ， 一 般 添 加 外 链 是 无 效 的 ， 正 确 添加 图 片 的 示例 程序 如 下 : 


#!/usr/bm/python3 


import smtplib 

from emaill.mme.mage 1mport MIMEImage 

from emall .mune.multipart import MIMEMujbpart 
from email.mrme.text import MIME Text 

from emallheader mmport Header 
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sender 三 Duaalandy 必 163.com 
receivers = [1005002008@qqcom] # 接收 邮件 ， 可 设置 为 QQ 邮箱 或 其 他 邮箱 


DiseRoot=MIMEMultpart(Trelated ) 
mseRoot[From'| = Header("buaalandy", utf-8") 
msgRoot['To'] = Header(" 测 试 邮件 ", "utf-8") 
subject ='Python SMTP 邮件 测试 
mseRoot|'Subject| = Header(subject, ‘utf-8") 


mseAlternative = MIMENMMuItpart(altermative') 


mseRoot.attach(mse Alternative) 
mall msg="" 
<p>Python 邮件 发 送 测 试 …*…</p> 


<p><a hre 伍 "http;//www.longleding.com"> 肥 领 医 疗 科技 </a></p> 
<p> 图 片 演示 : </p> 
<p>=Img src="cld:imagel"></p> 


和 


mseAlternative.attach(MIMEText(mail mse, html ‘utf-8")) 


# 指定 图 片 为 当前 目录 

tp = open('test.pne’, Tb) 

mseImaee = MIMEImage(tp.read()) 
fp.close() 


# 定义 图 片 DD， 在 HTML 文本 中 引用 
mseTmaee.add header(Content-ID', '<maegel>") 
inseRoot.attach(mselmage) 


try: 
smtpOb] = smtplib.SMTP(localhost) 
smtpOb].sendmail(sender. TecelVers. msgRoot.as strmg()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException: 
print ("Emror 无 法 发 送 邮 件 ") 


执行 以 上 程序 ， 若 邮件 发 送 成 功 ， 在 收 件 箱 中 就 可 以 看 到 带 图 片 的 邮件 。 
13.3.5 ”使 用 第 三 方 SMTP 服务 发 送 


这 里 使 用 QQ 邮箱 (也 可 以 使 用 163 邮箱 、Gmail 邮箱 ) 的 SMTP 服务 ， 但 需要 做 如 图 13-3 
所 示 的 配置 。 
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| 腾讯 网 画 ， 下 https: imailLqg.com/icgi-binyframe_html?sid=RT-iNSIkSK-OKRJC 昨 = 别 忆 | 搜索. 所 = 
| 到 QQ 邮箱 - 帐户 ; 
中 QQ 邮箱 。 | BanDEqq,com> 而 口 | 反馈 建 i [ 
[Le | mail qq.com 设置 上 换 肤 


Eh 收 全 


| 8 | 通讯 录 


收 件 菠 
星 标 晤 但 


> 邮箱 设 年 


常规 EE 收 信 规 则 。 反 培 圾 。 文件 夹 和 标签 ”其 他 邮箱 我 的 订阅 ”信纸 ”体验 室 


帐户 信息 
默认 帐户 甩 称 : | 随 凡 


( 慰 受 出 的 所 有 邮 忻 ,在 件 术 和 将 显示 你 的 邮箱 胞 种 ， 尺 还 可 | 加 每 个 帐 己 单 娃 设置 胞 称 。) 


图 13-3 ”邮箱 配置 


QQ 邮箱 通过 生成 授权 码 来 设置 密码 ， 如 图 13-4 所 示 。 


POP3/IMAP/SMTP/Exchange,/CardDAV /CalDAV 服 务 


开启 服务 : 


POP3/SMTP 上 服务 {如何 丁 用 Foxmail 等 软件 收发 邮件 ?) 已 开启 | 美 闭 
TIMAP/ 志 MTP 醒 邯 ( 什 世 是 JIMAP， 它 到 是 如 何 设置 > ) 已 开启 | 关闭 
Exchange 服 务 【什么 是 Exchange， 它 系 是 如 何 设置 ? 】 已 美 闭 | 开启 
CardDAV/CalDAV 眼 务 ( 慎 么 是 CardDAV/CalDAV， 它 又 是 如 何 设置 ? ) 已 美 闭 | 开启 


[POP3AIMAP/SMTP/CardDAV/CalDAYV 有 RE 劳 均 世 后 SSsL 连 接 。 册 何 贡 加 ? ) 


温 声 提示 : 在 第 三 方 登录 QQ 郎 箱 ， 可 能 存在 邮件 涝 需 刷 陆 
继续 获取 授权 码 登录 第 三 方 客户 端 邮 箱 国 


图 13-4 QQ 邮箱 生成 授权 码 


大豆 二 吉 4pple ID 安 全 ， 建 议 使 用 QQ 邮箱 手机 版 属 录 ， 


回 
de 
国 


国 
TI 


QQ 邮箱 的 SMTP 服务 器 地 址 为 smtp.qqcom，SSL 端口 为 465。 示 例 程 序 如 下 : 


#!/usr/bin/python3 


import smtplib 
from email.mme.text mport MIME Text 
from email.utils Import formataddr 


my sender'1005002008(@qq.com # 发 件 人 邮箱 账号 


Iny pass = XXXXXXXXXX 
Iny user=10053002008((qq.com 


def mail(): 
Te 人 [me 


try: 
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# 发 件 人 邮箱 密码 
# 收 件 人 邮箱 账号 ， 此 处 发 送 给 自己 


msgMIMEText( 填 写 邮件 内 容 ','plain',"utf-8") 

# 括号 里 对 应 的 是 发 件 人 邮箱 昵称 、 发 件 人 邮箱 账号 

mse[ From'|=tormataddr(["Frombuaalandy",my sender|) 

# 插 号 里 对 应 的 是 收 件 人 邮箱 昵称 、 收 件 人 邮箱 账号 
msel['To'|-formataddr(["FK".my userl) 
msg[Subject 二 "邮件 测试 "” ”# 邮件 的 主题 ， 也 可 以 说 是 标题 
# 发 件 人 邮箱 的 SMTP 服务 器 ， 端 口 是 25 
server=smtplib.SMIP SSL("smtp.qq.com", 465) 
server.login(my_sender, my_pass) # 括号 里 对 应 的 是 发 件 人 邮箱 账号 、 邮 箱 密码 
# 插 号 里 对 应 的 是 发 件 人 邮箱 账号 、 收 件 人 邮箱 账号 、 己 发 送 邮 件 
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server.sendmall(my sender,[my user,|.mse.as strine()) 
server.quit(” # 关闭 连接 

except Exception: # 如 果 try 中 的 语句 没有 执行 ， 则 执行 下 面 的 ret=False 
ret—False 

TetUm ret 


ret—mail() 

if ret: 
print(" 邮 件 发 送 成 功 ") 

else: 
print(" 邮 件 发 送 失 败 ") 


执行 以 上 程序 ， 寿 邮件 发 送 成 功 ， 登 录 收 件 人 邮箱 即 可 碍 看 收 到 的 邮件 。 


接收 Internet 邮件 


SMTP 用 于 发 送 邮件 ， 如 果 要 收取 邮件 呢 ? 

收取 邮件 就 是 编写 客户 端 ， 从 邮件 服务 器 把 邮件 下 载 到 用 户 的 计算 机 或 手机 上 。 收 取 邮 件 
最 第 用 的 协议 是 POP3 协议 。 

Python 内 置 的 poplib 模块 实现 了 POP3 协议 ， 可 以 直接 用 来 收取 邮件 。 

注意 ，POP3 协议 收取 的 不 是 已 经 可 以 阅读 的 邮件 本 身 ， 而 是 邮件 的 原始 文本 ， 这 和 SMTP 
协议 很 像 ，SMTP 发 送 的 也 是 经 过 编码 后 的 一 大 段 文本 。 

要 把 POP3 收取 的 文本 变 成 可 以 阅读 的 邮件 ， 还 需要 用 email 模块 提供 的 各 种 类 来 解析 原 
始 文本 ， 使 之 变 成 可 阅读 的 邮件 对 象 。 所 以 ， 收 取 邮 件 分 以 下 两 步 : 

第 一 步 : 用 poplib 把 邮件 的 原始 文本 下 载 到 本 地 。 

第 二 步 : 用 email 模块 解析 原始 文本 ， 还 原 为 邮件 对 象 。 


13.4.1 通过 POP3 下 载 邮件 
POP3 协议 本 身 很 简单 。 下 面 的 程序 获取 最 新 的 一 封 邮件 的 内 容 。 
Importpophp 


# 输入 邮件 地 址 、 口 令 和 POP3 服务 器 地 址 
emall = mput(Email: ') 

password = mput(Password: ") 

pop3 server = mput(POP3 server: ") 


# 连接 到 POP3 服务 器 

server = poplib.POP3(pop3 server) 

# 可 以 打开 或 关闭 调试 信息 

server.set debuelevel(]1) 

# 可 选 : 打印 POP3 服务 器 的 欢迎 文字 
print(server.getwelcome().decode('‘utf-8")) 
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# 身份 认证 
server.user(emall) 
seIver.pass (password) 


# stat0 返 回 邮 件数 量 和 占用 空间 
print(Messages: %s. S1Ze: 90S' % server.stat()) 

# list0 返 回 所 有 邮件 的 编号 

resp. Dalls. octets = server.list() 

# 可 以 得 看 返回 的 列表 [b'1 82923', b'2 2184. …] 
print(mails) 


# 获取 最 新 的 一 封 邮件 , 注意 索引 号 从 1 开始 
Index = len(mails) 
resp, lines, octets = server.retr(mdex) 


# lines 用 于 存储 邮件 的 原始 文本 的 每 一 行 
# 可 以 获得 整个 邮件 的 原始 文本 

mse content= brn'.jom(lnes).decode(‘utf-8") 
# 稍 后 解析 出 邮件 

msg = Parser().parsestr(mse content) 


# 可 以 根据 邮件 索引 号 直接 从 服务 器 删除 邮件 
# server.dele(Index) 

# 关闭 连接 

server.quit() 


用 POP3 获取 邮件 其 实 很 简单 ， 要 获取 所 有 邮件 ， 只 需要 循环 使 用 retr0 把 每 一 封 邮件 的 内 
容 拿 到 即 可 。 真 正 麻 烦 的 是 把 邮件 的 原始 内 容 解析 为 可 以 阅读 的 邮件 对 象 。 
13.4.2 ”解析 邮件 

解析 邮件 的 过 程 和 构造 邮件 正好 相反 ， 因 此 ， 需 要 先导 入 必要 的 模块 : 


from emallparser 1mport Parser 
from emallheader Import decode header 
from email.utils Import parseaddr 


1mport poplib 
只 需要 一 行 代 码 歌 可 以 把 邮件 内 容 解析 为 Message 对 象 : 
msg = Parser().parsestr(mse content) 


但 是 ，Message 对 象 本 对 可 能 是 MIMEMultipart 对 象 ， 也 就 是 可 以 艇 套 其 他 MIMEBase 对 
象 ， 甚 至 散 套 的 可 能 还 不 止 一 层 ， 所 以 要 递归 地 打印 出 Message 对 象 的 层次 结构 。 示 例如 下 : 


# indent 用 于 缩 进 显示 
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def print info(msg, mdent=0): 
if indent— 0: 
for header m [From' "To', Sublect |: 
Value = mse.get(header, ") 
if value: 
1 header—Subject': 
value = decode str(value) 
else: 
hdr addr = parseaddr(value) 
name = decode str(hdr) 
Value = U's <00s> % (name. addr) 
print(%os%os: %0s Yo ( '* mdent, header, value)) 
1{ (msg.1s multpart(O)): 
parts = msg.get payload() 


for n, part In enumerate(parts): 
pnnt(9%ospart %os %o 0"'* mdent, n)) 
PIC90S-- 一 一 一 一 -一 一 一 2%(0 Indenb) 


prnt mfo(part, Indent + 1) 
else: 
content type = msg.get content type() 
if content type—'text/plam or content type—text/html: 
content = msg.get payload(decode=True) 
charset = euess charset(mse) 
1{ charset: 
content = content.decode(charset) 
print(%osText: %s' %( '* ndent, content +"...")) 
else: 
prnt(%osAttachment: %os' 9% ( Indent content type)) 


邮件 的 Subject 或 Email 中 包含 的 名 字 痢 是 经 过 编码 后 的 字符 串 ， 要 止 剃 显 示 ， 就 必须 进行 
解码 : 


def decode str(s): 
value, charset = decode header(s)[0]| 
1f charset: 
Value = value.decode(charset) 
retum value 


decode header0 返 回 一 个 列表 ， 因 为 像 Cc、Bee 这 样 的 字段 可 能 包含 多 个 邮件 地 址 ， 所 以 
解析 出 来 的 元 素 会 有 多 个 。 上 面 的 代码 只 取 了 第 一 个 元 素 。 
文本 邮件 的 内 容 也 是 字符 串 ， 还 需要 检测 编码 ， 否 则 非 utf-8 编码 的 邮件 将 无 法 正常 显示 : 


def guess charset(mse): 
charset = mseg.get charset() 
1{ charset 1s None: 
content type = msg.get(Content-Type', ").lower() 
pos = content type.find('charset=") 
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i pos >= 0: 
charset = content typelpos + 8:].strpO 
return charset 


把 上 面 的 代码 整理 好 ， 吏 可 以 试 着 收取 一 封 邮件 。 首 先 往 上 自己 的 邮箱 发 一 封 邮 件 ， 人 然后 用 
浏览 器 登录 邮箱 ， 看 看 邮件 收 到 没有 ， 如 果 收 到 了 ， 就 用 Python 程序 把 它 收 到 本 地 。 

运行 程序 ， 结 果 如 下 : 

+OK Welcome to coremall Mall POP3 Server (163coms|...|) 

Messapes: 126. Size: 27228317 


From: Test <xxXxxxx((Dqq.Ccom> 
To: Python 爱好 者 <xxxXXXX(@163.com>= 
Subject: 用 POP3 收取 邮件 


part 0 

Tt Python 可 以 使 用 POP3 收取 邮件 ……. 

part 1 

Text Python 可 以 <a lieE-， 使 用 POP3<> 收 取 邮 件 …-。 
part 1 


Attachment: application/octet-stream 


从 输出 结果 可 以 看 出 ， 这 封 邮 件 是 一 个 MIMEMultipart， 它 包含 两 部 分 ， 第 一 部 分 是 一 个 
MIMEMultipart， 第 二 部 分 是 一 个 附件 。 内 购 的 MIMEMultipart 是 altemative 类 型 ， 里 面 分 别 包 
合 纯 文本 格式 和 HTML 格式 的 MIMEText。 

这 里 小 结 一 下 ， 用 Python 的 poplib 模块 收取 邮件 分 两 步 : 第 一 步 是 用 POP3 协议 把 邮件 获 
取 到 本 地 ， 第 二 步 是 用 email 模块 把 原始 邮件 解析 为 Message 对 象 。 最 后 ， 用 适当 的 形式 把 邮 
件 内 容 展示 给 用 户 即 可 。 


套 接 字 编程 


到 目前 为 止 ， 已经 介绍 了 与 一 种 Internet 应 用 程序 上-maiD 相 关 的 协议 和 文件 格式 。E-mail 
当然 是 一 种 通用 且 有 用 的 应 用 程序 ， 但 是 E-mail 相关 的 协议 只 是 在 Pntemet 协议 上 实现 的 众 
多 协议 中 的 极 少 数 几 个 。Python 通过 提供 包装 库 使 得 使 用 E-mail 相关 的 协议 变 得 容易 ， 但 是 
Python 并 没有 为 每 个 网 络 协议 提供 一 个 库 。 对 于 为 Intemet 应 用 程序 创建 的 新 协议 ， 肯定 没有 
对 应 的 库 。 

为 了 编写 自己 的 协议 ， 或 者 实现 与 imaplib 或 poplib 相似 的 Python 库 ， 需 要 癌 下 走 一 层 ， 
并 且 学 习 基 于 了 P 协议 的 编程 接口 的 工作 方式 。 幸 好 编写 这 样 的 代码 并 不 困难 : 利用 smtplib、 
poplib 和 其 他 一 些 模块 可 以 较为 容易 地 实现 。 秘 诀 在 于 套 接 字库 ， 它 使 得 读 写 网 络 接口 就 如 同 
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读 写 磁盘 上 的 文件 一 样 。 
13.5.1 TCP 编程 


Socket( 套 接 字 ) 是 网 络 编程 中 的 一 个 抽象 概念 。 通 向 我 们 用 Socket 表示 “打开 了 一 个 网 络 
连接 ”， 而 打开 Socket 需要 知道 目标 计算 机 的 他 地 址 和 端口 号 ， 再 指定 协议 类 型 即 可 。 


1. 客户 端 编程 


大 多 数 连 接 都 是 可 靠 的 TCP 连接 。 创 建 TCP 连接 时 ， 主 动 发 起 连接 的 叫 客户 端 ， 被 动 响 
应 连接 的 叫 服务 费 。 

举 个 例子 ， 当 在 浏览 副 中 访问 新 沪 网 时 ， 浏 览 如 就 是 客户 端 ， 浏 览 右 会 主动 回 新 浪 网 的 服 
务 右 发 起 连接 。 如 果 一 切 顺 利 ， 新 浪 网 的 服务 器 接受 连接 ， 一 个 TCP 连接 就 会 建立 起 来 ， 后 面 

所 以 ， 要 创建 基于 TCP 连接 的 Socket， 可 以 这 样 做 : 

# 导入 socket 库 

1mport socket 


# 创建 一 个 Socket 
s= socket.socket(socket.AF INET. socket.SOCEK STREAM) 
# 建立 连接 


s.connect((WwWWw.sina.com.cn'. 80)) 


创建 Socket 时 ，AF JINET 指定 使 用 IPv4 协议 ， 如 果 要 用 更 先进 的 Pv6 协议 ， 就 指定 为 
AF INET6。SOCK STREAM 指定 使 用 面 问 流 的 TCP 协议 ， 这 样 ，Socket 对 象 就 创建 成 功 了 ， 
但 是 还 没有 建立 连接 。 

客户 端 要 主动 发 起 TCP 连接 ， 必 须知 道 服务 器 的 卫 地 址 和 端口 号 。 新 浪 网 的 中 地址 可 以 
用 域名 www.sina.com.cn 目 动 转换 得 到 ， 但 是 怎么 知道 服务 器 的 端口 号 呢 ? 

答案 是 作为 服务 器 ， 提 供 什 么 样 的 服务 ， 端 口号 就 必须 固定 下 来 。 由 于 想 要 访问 网 页 ， 因 
此 提供 网 页 服务 的 服务 器 必须 把 端口 号 固定 为 80 端口 ， 因 为 80 端口 是 Web 服务 的 标准 端口 。 
其 他 服务 都 有 对 应 的 标准 端口 号 ， 例 如 SMTP 服务 是 25 端口 ，FTP 服务 是 21 端口 ， 等 等 。 端 
口号 小 于 1024 的 是 Intemet 标准 服务 的 端口 ， 端 口号 大 于 1024 的 可 以 任意 使 用 。 

因此 ， 连 接 服务 器 的 代码 如 下 : 


s.connect((WwWw.sina.com.cn', 80)) 


注意 参数 是 一 个 元 组 ， 包 含 地 址 和 端口 号 。 

建立 TCP 连接 后 ， 就 可 以 回 服务 器 发 送 请 求 ， 要 求 返 回放 页 的 内 容 了 : 
# 发 送 数据 

s.send(b'GET / HTTP/1.l1rnHost: WWw.sina.com.cmr nConnection: closewmD ) 


TCP 连接 创建 的 是 双 回 通道 ， 双 方 都 可 以 同时 给 对 方 发 数据 。 但 是 谁 先 发 谁 后 发 ， 怎 么 协 
调 ， 要 根据 具体 的 协议 来 决定 。 例 如 ，HTTP 协议 规定 客户 端 必 须 先 发 请 求 给 服务 占 ， 服 务 器 
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收 到 后 才 及 数据 给 客户 靖 。 
发 送 的 文本 格式 必须 符合 HITP 标准 ， 如 果 格 式 没 问题 ， 接 下 来 束 可 以 接收 服务 吉 返 回 的 
数据 了 : 


# 接收 数据 
buffer = [] 
while True: 
# 每 次 最 多 接收 1KB 
d= s.recv(1024) 
fd: 
buffer.append(d) 
else: 
break 
data = b".jJom(buffer) 
接收 数据 时 ， 调 用 recv(max) 方 法 ， 一 次 最 多 接收 指定 的 字 节 数 。 因 此 ， 在 一 个 while 循环 
中 反复 接收 ， 直 到 recv0 返 回 空 数据， 表示 接收 完毕 ， 退 出 循环 。 
接收 完 数据 后 ， 调 用 close0 方 法 以 关闭 Socket， 这 样 ， 一 次 完整 的 网 络 通 信和 就 结束 了 : 
# 关闭 连接 
s.close() 


接收 到 的 数据 包括 HTTP 头 和 网 页 本 身 ， 只 需要 把 HITP 头 和 网 页 分 离 一 下 ， 把 HTTP 头 
打印 出 来 ， 将 网 页 内 容 保存 到 文件 中 : 


header, html = data.split(bATOTD'， 1) 

print(theader.decodeCutt-8)) 

# 把 接收 的 数据 写 入 文件 

with open('sina.html', wb') ast: 
fwrite(html) 


现在 ， 只 需要 在 浏览 器 中 打开 sina.html 文件 ， 束 可 以 看 到 新 浪 网 的 首页 了 。 
2. 服务 器 编程 


和 客户 端 编程 相 比 ， 服 务 器 编程 就 要 复杂 一 些 。 服 务 器 进程 前 先 要 绑 定 一 个 端口 并 监听 来 
日 其 他 客户 端的 连接 。 ey 服务 器 就 与 该 客户 端 建 并 Socket 连接 ， 随 
后 的 通信 和 就 靠 这 个 Socket 连接 了。 

所 以 ， 服 务 器 会 打开 固定 端口 (比如 端口 8)， 监 听 传 过 来 的 每 一 个 客户 端 连接 ， 建 立 起 
Socket 连接 。 由 于 服务 器 会 有 大 量 来 自 客户 端的 连接 ， 因 此 服务 器 需要 能 够 区 分 一 个 Socket 连 
接 是 和 哪个 客户 端 绑 定 的 。 可 通过 服务 嚣 地址、 服务器 端口 、 客 户 端 地 址 、 客 户 端 端口 来 唯一 
确定 一 个 Socket。 

但 是 服务 器 还 需要 同时 啊 应 多 个 客户 端的 请 求 ， 所 以 ， 每 个 连接 都 需要 有 新 的 进程 或 线程 
来 处 理 ， 否 则 ， 服 务 器 一 次 就 只 能 服务 一 个 客户 端 了 。 

下 面 编 写 一 个 简单 的 服务 器 程序 , 它 接 收 客 户 端 连 接 , 把 客户 端 发 过 来 的 字符 串 加 上 Hello 
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后 发 回去 。 
首先 ， 创 建 一 个 基于 IPv4 和 TCP 协议 的 Socket: 


s= socket.socket(socket.AF INET., socket.SOCKE STREAMI 


然后 , 要 绑 定 监听 的 地 址 和 端口 。 服务 器 可 能 有 多 块 网 卡 , 可 以 绑 定 到 某 块 网 卡 的 卫 地 址 ， 
也 可 以 用 0.0.0.0 绑 定 到 所 有 的 网 络 地 址 ,还 可 以 用 127.0.0.1 绑 定 到 本 机 地 址 。127.0.0.1 是 一 个 
特殊 的 他 地 址 , 表示 本 机 地 址 , 如 果 绑 定 到 这 个 地 址 , 客户 端 就 必须 同时 在 本 机 运行 才能 连接 ， 
也 就 是 说 ， 外 部 的 计算 机 无 法 连接 进来 。 

端口 号 需要 预先 指定 。 因 为 这 个 服务 不 是 标准 服务 ， 所 以 使 用 9999 这 个 端口 号 。 请 注意 ， 
小 于 1024 的 端口 号 必须 有 管理 员 权 限 才 能 绑 定 : 


# 监听 端口 
sbind(0127.0.0.1. 9999)) 


泽 接 痢 调用 listen0 方 法 ， 开 始 监 听 端 口 ， 传 入 的 参数 指定 了 等 行 连接 的 最 大 数量 : 


s.listen($) 
print(Waiting for connection...") 


接 下 来 ， 服 务 器 通过 一 个 永久 循环 来 接收 来 自 客户 端的 连接 ，accept0 会 等 待 并 返回 一 个 窜 
户 端 的 连接 : 


while True: 
# 接收 一 个 新 连接 
sock., addr = s.accept() 
# 创建 新 线程 来 处 理 TCP 连接 
t= threadmeg. Thread(target=tcplink, args—=(sock, addr)) 
t.start() 


每 个 连接 都 必须 创建 新 线程 (或 进程) 来 处 理 ， 否 则 ， 单 线程 在 处 理 连接 的 过 程 中 ， 无 法 接 
收 其 他 客户 端的 连接 : 


def tcplink(sock, addr): 

print( Accept new connection from %s:%s...' %0 addr) 
sock.send(b"Welcome!') 
while True: 

data = sock.recv(1024) 

time.sleep(1) 

lf not data or data.decode('utf-8") — ‘exit' 

break 

sock.send(('Hello., %s!' % data.decode('utf-8")).encode('utf{-8")) 
sock.close() 
print( Connection from %os:%s closed % addr) 


连接 建立 后 ， 服 务 规 首先 发 一 条 欢迎 消 轧 ， 然 后 等 待 客户 端 数据 ， 并 加 上 Hello 后 发 送 给 
客户 问 。 如 果 客 户 端 发 送 了 exit 字符 串 ， 就 直接 关闭 连接 。 
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要 测试 这 个 服务 上 佛 程序， 还 裔 要 编写 如 下 客户 端 程序 : 


s= socket.socket(socket.AF INET. socket.SOCK STREAM) 
# 建立 连接 
s.connect((127.0.0.1'. 9999)) 
# 接收 欢迎 消 轧 
print(s.recv(1024).decode('utf-8")) 
for data Im [b'MVlichael', b'Tracy', b'Sarah'|: 
# 发 送 数 据 
s.send(data) 
print(s.recv(1024).decode( utf-8")) 
s.send(b'exit') 
s.close() 


需要 打开 两 个 命令 行 窗 口 ， 一 个 运行 服务 器 程序 ， 另 一 个 运行 客户 端 程 序 ， 束 可 以 看 到 效 
果 了 ， 如 图 13-$ 所 示 。 


Command Prompt 


3 python echo server.py 
WaltLNnG "FOE Cornntet Lor .ss 

Accept new connection from 127.0.0.1:64398... 
Connection from: 1217.0.0.1:64398 closed., 


Command Prompt 


$s Python echo client.py 
Welcome! 
Hello, Michael! 

-Hello, Tracy! 

Hello, Sarah! 

S 


图 13-5 运行 效果 


需要 注意 的 是 ， 客 户 端 程序 运行 完毕 就 退出 了 ， 而 服务 器 程序 会 永远 运行 下 去 ， 必 须 按 
Ctrl+HC 组 合 键 才能 退出 程序 。 

这 里 小 结 一 下 ， 用 TCP 协议 进行 Socket 编程 在 Python 中 十 分 简单 ， 对 于 客户 端 ， 要 主动 
连接 服务 器 的 卫 地 址 和 指定 端口 ; 对 于 服务 器 ， 首 先 要 监听 指定 的 端口 ， 然 后 ， 对 每 一 个 新 的 
连接 ， 创 建 线程 或 进程 来 处 理 。 通 常 ， 服 务 器 程序 会 无 限 运行 下 去 。 

同一 个 端口 ， 被 一 个 Socket 绑 定 以 后 ， 就 不 能 被 别 的 Socket 绑 定 了 。 


13.5.2 UDP 编程 


TCP 用 于 建立 可 靠 连 接 ， 并且 通信 双方 都 可 以 以 流 的 形式 发 送 数据 。 相 对 TCP, UDP 则 是 
面向 无 连接 的 协议 。 
使 用 UDP 协议 时 ， 不 需要 建立 连接 ， 只 需要 知道 对 方 的 卫 地 址 和 端口 号 ， 就 可 以 直接 发 
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数据 包 。 但 是 ， 能 不 能 到 达 就 不 知道 了 。 

虽然 用 UDP 传输 数据 不 可 靠 ， 但 优点 是 ， 速 度 比 TCP 快 ， 对 于 不 要 求 可 徘 到 达 的 数据 ， 
就 可 以 使 用 UDP 协议。 

下 面 来 看 看 如 何 通 过 UDP 协议 传输 数据 。 和 TCP 类 似 , 使 用 UDP 的 通信 双方 也 分 为 客户 
端 和 服务 器 。 服 务 器 首先 需要 绑 定 端口 : 


s= socket.socket(socket.AF INET. socket.SOCK DGRAM) 
# 绑 定 端口 
s.bind((127.0.0.1'. 9999)) 


创建 Socket 时 ，SOCK DGRAM 指定 了 Socket 的 类 型 是 UDP。 绑 定 端口 时 和 TCP 一 样 ， 
但 是 不 需要 调用 listen0 方 法 ， 而 是 直接 接收 来 自任 何 客户 端的 数据 : 


print( Bnd UDP on 9999...) 

WwWhlle True: 
# 接收 数据 
data addr = s.recvfrom(1024) 
print(Receved from %os:%os. % addr) 
s.sendto(b'Hello. %s!" % data, addr) 


recvfrom0 方 法 返回 数据 和 客户 端的 卫 地 址 与 端口 ， 这 样 ， 服 务 器 收 到 数据 后 ， 直 接 调 用 
sendto0 就 可 以 把 数据 用 UDP 发 给 客户 端 。 

注意 这 里 省 挥 了 多 线程 ， 因 为 这 个 例子 很 简单 。 

客户 端 使 用 UDP 时 ， 首 先 仍然 创建 基于 UDP 的 Socket， 人 然后， 不 需要 调用 connect0， 直 
接 通过 sendto0 给 服务 器 发 数据 : 


s = socket.socket(socket.AF INET. socket.SOCK DGRAM) 
for data in [b' Michael', b'Tracy’, b'Sarah']: 

# 发 送 数据 

s.sendto(data, (127.0.0.1", 9999)) 

# 接收 数据 

print(s.recv(1024).decode('utf{-8")) 
s.close() 


从 服务 器 接收 数据 时 仍然 调用 recv0 方 法 。 
我 们 仍然 用 两 个 命令 行 分别 进 行 服务 器 和 客户 端 测试 ， 结 果 如 下 : 


# 服 务 器 

CAUsSsers\LandyDesktopmrolects>python udp server.py 
Blind UDP on 9999... 

Recelved from 127.0.0.1:63823... 

Received from 127.0.0.1:63823... 

Recelved from 127.0.0.1:63823... 

# 客 户 端 

Ci\Users\Landy\Desktop'\projects=>python udp chentpy 
Welcome! 
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Hello.Michael! 
Hello, Tracy! 
Hello.Sarah! 


UDP 的 使 用 与 TCP 类 似 ， 但 是 不 需要 建立 连接 。 此 外 ， 服 务 器 绑 定 的 UDP 端口 和 TCP 
端口 互 不 冲突 ， 也 就 是 说 ，UDP 的 9999 端口 与 TCP 的 9999 端口 可 以 各 自 绑 定 。 


本 章 小 结 


Python 提供 了 可 以 使 用 现 有 的 基于 TCP/IP 的 协议 的 高 层 工具 ， 使 得 编写 自 定义 客户 端 变 
得 容易 ,另外 还 打包 了 可 以 帮助 设计 自己 的 网 络 应 用 程序 的 工具 。 不 论 是 希望 从 脚本 发 送 邮件 ， 
还 是 想 实现 Intemet 的 下 一 个 关键 应 用 程序 ，Python 都 可 以 满足 任何 需要 。 本 章 首先 介绍 了 网 
络 编程 的 基础 知识 和 TCP/P 协议 ， 然 后 介绍 了 如 何 发 送 和 接收 邮件 ， 最 后 介绍 的 是 套 接 字 编 
程 。 通过 本 章 的 学 习 ， 大 家 应 能 了 解 网 络 通信 的 基本 原理 ， 知 道 如 何 使 用 Python 语言 来 实现 网 
络 编程 、 收 发 邮件 和 套 接 字 编程。 


思考 和 练习 


. 简单 描述 TCP/TP 协议 体系 ? 分 别 介绍 五 层 协议 中 每 一 层 的 功能 。 

. 基于 TCP 协议 通信 ， 为 何 建立 连接 需要 三 次 握手 ， 而 断 开 连接 却 需 要 四 次 握手 ? 
. 为 何 基于 TCP 协议 的 通信 比 基 于 UDP 协议 的 通信 更 可 靠 ? 

. 流 式 协 议 指 的 是 什么 协议 ， 数 据 报 协议 指 的 是 什么 协议 ? 

. 什么 是 Socket? 简 述 基于 TCP 协议 的 套 接 字 通 信 流 程 。 

. 基于 HTTP 开发 一 个 程序 ， 可 以 访问 百度 首页 ， 并 将 访问 内 容 下 载 保存 。 

. 编写 收发 邮件 的 客户 端 。 

. 基于 Socket 开发 一 个 聊天 程序 ， 实 现 两 端 互相 发 送 和 接收 消息 。 


2 ~] oh 上 ha 捕 
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本 章 将 基于 Django 框架 创建 一 个 投票 管理 系统 。 

Web 应 用 开发 是 目前 的 主流 开发 方 同 之 一 。Web 应 用 要 运行 起 来 ， 需 要 很 多 技术 的 文 撑 ， 
但 开发 人 员 不 能 都 一 一 编写 代码 ， 最 好 的 方式 是 找 一 个 成 熟 的 Web 框架 ， 然 后 基于 Web 框架 
进行 开发 。 

几乎 每 一 种 开发 语言 都 有 全 少 一 种 (经 常 有 好 几 种 )Web 框架 ，Python 也 不 例外 。Diango 丈 
是 基于 Python 构建 的 标准 Web 框架 , 很 多 Python 开发 人 员 通 过 Django 来 快速 开发 Web 应用。 

阅读 本 章 之 前 ， 你 需要 了 解 一 些 Web 开发 的 基本 知识 ， 以 及 Web 管理 系统 如 何 开 发 ， 这 
样 可 以 更 好 地 理解 本 章 的 内 容 。 通 过 本 章 的 学 习 ， 大 家 应 能 够 使 用 Django 框架 开发 Web 应 用 。 


本 章 的 学 习 目标 : 

了 解 Web 框架 的 功能 以 及 使 用 理由 ; 

部 芒 Django 框 淋 的 安装 操作 :; 

掌握 使 用 Django 框架 创建 项 目 和 创建 投票 应 用 的 方法 ， 并 熟悉 生成 的 目录 ; 
掌握 为 投票 管理 系统 配置 数据 库 连接 的 方法 ; 

掌握 为 投票 管理 系统 创建 模型 、 视 图 的 方法 ; 

掌握 为 投票 管理 系统 配置 URL、 使 用 模板 的 方法 ; 

掌握 Django 框 浪 中 静态 资源 的 管理 方式 。 

了 解 Web 应 用 的 打包 和 发 布 。 


14.1.1 Web 框架 的 基础 功能 


前 面 简单 提 到 了 “Web 框 染 ” 这 个 词 ， 但 是 没有 解释 这 个 词 到 奔 是 什么 意思 。 要 想 完 全 理 
解 什么 是 Web 框架 ， 以 及 为 什么 要 使 用 Web 框架 ， 束 必须 理解 几乎 所 有 Web 应 用 和 使 用 数据 
库 的 Web 站 点 的 核心 基础 。 

首先 是 数据 库 连 接 。 这 是 几乎 所 有 Web 应 用 的 关键 部 分 。 数 据 库 包 含 很 多 甚至 多 到 无 法 想 
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象 的 记录 。 诸 如 用 户 名 、 用 户 权 限 、 设 置 、 评 论 和 个 人 资料 等 许多 的 信息 都 存储 在 数据 库 中 。 
Django 文 持 好 几 种 数据 库 ， 有 些 需 要 使 用 SQL， 而 男 一 些 不 需要 。 

然后 是 管理 面板 。 通 过 管理 面板 ， 管 理 员 和 其 他 人 可 以 使 用 存储 在 数据 库 中 的 所 有 数据 。 
例如 ， 如 果 需 要 将 用 户 的 权限 从 注册 用 户 提 升 到 超级 管理 员 ， 就 需要 使 用 管理 面板 。 

最 后 是 留言 。 尺 管 看 上 去 大 量 无 用 的 用 户 留言 正在 侵蚀 Web 站 点 的 领地 , 但 是 留言 功能 
然 是 任何 设计 良好 的 Web 站 点 的 重要 功能 。 留言 功能 使 用 户 觉 得 他 们 是 社区 的 一 部 分 ， 而 不 是 
目 说 目 话 。 

这 类 Web 站 点 的 男 一 项 重要 功能 是 用 户 壬 份 验 证 。 这 种 功能 控制 用 户 登 录 的 方式 , 确保 登 
录 安 全 ， 并 决定 用 户 对 Web 站 点 拥有 的 权限 等 。 

这 些 只 是 设计 良好 的 Web 应 用 的 一 小 部 分 功能 而 已 。 可 以 看 出 ， 设 计 Web 应 用 需要 考虑 
很 多 方面 ， 而 且 需 要 做 很 多 编程 工作 。 而 且 ， 事 实 上 这 些 工作 并 没有 什么 意思 。 我 们 甚 全 还 没 
有 开始 考虑 用 户 界面 和 设计 的 问题 ， 而 它们 才 应 该 是 设计 Web 站 点 时 需要 主要 关注 的 方面 。 

在 没有 框架 的 时 候 ， 程 序 员 必须 手工 编写 上 面 列 出 的 所 有 功能 和 其 他 功能 的 代码 ， 这 会 耗 
费 大 量 时 间 ， 从 而 增加 产品 的 成 本 。 泣 运 的 是 ， 框 架 可 以 帮 有 我 们 完成 那些 无 聊 的 工作 。 使 用 
Django 时 ， 以 上 那些 功能 ， 甚 至 更 多 的 功能 ， 都 可 以 迅速 实现 。 


14.1.2 ”Web 框架 的 其 他 通用 功能 


e URL 映射 和 一 些 框架 (特别 是 Django) 可 以 解释 URL, 这 样 URL 将 对 用 户 更 加 友好 且 直 
观 ， 更 重要 的 是 ， 方 便 搜索 引擎 进行 索引 。 例 如 ， 有 一 个 URL 为 /mypage. 
cgi?cat=comic&topic=superman。URL 映射 功能 可 以 将 这 个 URL 转换 为 更 简单 的 地 址 ， 
如 /mypage/comic/superman。 如 果 Web 站 点 的 访问 者 还 想 访 问 这 个 页 面 ， 他 们 更 有 可 能 
记 住 这 个 URL， 而 且 搜 索引 擎 也 能 更 好 地 理解 Web 站 点 的 底层 结构 。 

e Web 绥 存 一 一 Web 缓存 指 的 是 保存 文档 副本 的 过 程 。 当 重新 访问 一 个 页 面 的 时 候 ， 如 
果 满 足 某 种 条 件 ， 这 个 页 面 可 以 直接 从 内 存 中 加 载 ， 而 不 用 请 求 新 页 面 。 因 此 ，Web 
绥 存 可 以 提高 页 面 加 载 的 速度 ， 提 高 Web 站 点 的 整体 可 用 性 。 

e 模板 一 一 通过 模板 可 以 使 整个 Web 站 点 的 风格 统一 ， 还 能 达到 其 他 很 多 目的 。 首 先 ， 
Web 站 点 看 上 去 很 专业 。 其 次 , 可 以 确保 用 户 不 会 感到 疑惑 , 误 认 为 他 们 已 经 离开 Web 
站 上 点。 最后， 模板 可 以 创造 出 良好 的 体验 ,这样 Web 站 点 的 每 一 部 分 行为 都 符合 预期 。 
例如 ， 如 果 在 一 个 页 面 上 单 击 “ 打 印 ” 按 钮 可 以 打印 文档 ， 那 么 在 其 他 所 有 页 面 上 单 
击 “ 打 印 ” 按 钮 都 应 该 有 一 致 的 功能 ， 而 且 “ 打 印 ” 按 钮 应 该 在 同一 个 位 置 。 模 板 更 
重要 的 功能 是 可 以 减少 Web 站 点 内 页 面 的 数目 。 通 过 使 用 “ 平 页 面 ”(flat page)， 站 点 
可 以 访问 数据 库 并 获取 特定 数据 ， 将 这 些 数据 显示 在 页 面 上 。 假 设 Web 站 点 的 功能 是 
列 出 作者 的 简历 ， 而 这 个 Web 站 点 可 以 列 出 10 000 个 作者 的 简历 。 如 果 采 用 老 办 法 ， 
可 能 必须 编写 10 000 个 页 面 ， 而 每 一 个 作者 一 个 页 面 。 而 使 用 模板 功能 ， 只 要 创建 一 
个 平 页 面 即 可 ， 这 个 平 页 面 可 以 读 取 数据 库 ， 并 且 填 入 每 个 作者 的 信息 。 因 此 ， 实 质 
上 只 有 一 个 页 面 ， 但 是 这 个 页 面 可 以 动态 变化 为 很 多 页 面 。 

对 Web 框架 及 其 功能 的 完整 介绍 超出 了 本 书 的 讨论 范围 , 但 是 有 了 上 面 的 介绍 ， 你 应 该 已 

经 理解 Web 框架 能 够 实现 多 种 可 能 性 。 
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Django 框架 的 安装 


Python 有 许多 款 不 同 的 Web 框架 。Diango 是 重量 级 选手 中 最 有 代表 性 的 一 位 。Diango 尊 
守 BSD 版 权 ， 初 次 发 布 于 2005 年 7 月 ， 并 于 2008 年 9 月 发 布 了 第 一 个 正式 版 本 1.0。 


14.2.1 ”Django 框架 的 特点 


Django 是 用 Python 开发 的 一 个 免费 、 开 源 的 Web 框架 ， 可 以 用 于 快速 搭建 高 性 能 、 优 和 雅 
的 网 站 。 

Django 具有 如 下 特点 。 

e 织 大 的 数据 库 功能 : 拥有 强大 的 数据 库 操 作 接 口 (QuerySet APD， 也 能 执行 原生 SQL 。 
目 带 强大 后 台 : 拥有 强大 的 后 台 ， 可 轻松 管理 内 容 。 
优雅 的 网 址 : 用 正则 匹配 网 址 ， 传 递 到 对 应 函数 ， 随 意 定义 。 
模板 系统 易 扩 展 的 模板 系统 ， 设 计 简 易 ， 人 代码 、 样 式 分 开设 计 ， 更 容易 管理 。 
绥 存 系统 : 与 Memcached、Redis 等 缓存 系统 联 用 ， 有 具有 更 出 色 的 表现 、 更 快 的 加 载 
速度 。 
e 国际 化 : 完全 文 持 多 国语 言 应 用 ， 人 允许 定义 翻译 的 字符 ， 从 而 轻松 翻译 成 不 同 国家 的 


语言 。 
14.2.2” Django 框架 的 版 本 


截至 目前 ，Django 的 最 新 版 本 为 2.0。Djanego 框架 用 Python 语言 编写 ， 不 同 的 Django 版 
本 对 应 不 同 版 本 的 Python 语言 ， 如 表 14-1 所 示 。 


表 14-1 Django 版 本 与 对 应 的 Python 版 本 


Dijango 版 本 Python 版 本 

] .8 3 
1.9、1.10 i pe 

1.11 中， 3 

2.0 3.5+ 


许多 成 功 的 网 站 和 APP 都 基于 Django。Django 最 初 被 设计 用 于 具有 快速 开发 需求 的 新 闻 
类 站 点 ， 目 的 是 实现 简单 、 快 捷 的 网 站 开 有 友 。Django 采用 MVC 软件 设计 模式 ，M 代表 模型 ， 
V 代表 视图 、C 代表 控制 器 。 


14.2.3 在 Windows 下 安装 Django 


首先 安装 Python， 由 于 前 面 已 经 安装 了 了 Python， 这 里 不 再 葡 述 。 

接着 安装 Django。 下 载 Django 压缩 包 ， 解 压 并 和 Python 安装 目录 放 在 同一 个 根 目 录 下 ， 
进入 Django 目录 ， 执 行 python setup.py install， 然 后 开始 安装 ，Django 将 被 安装 到 Python 的 
Lib/site-packages 下 。 

也 可 以 在 命令 提示 符 窗 口中 运行 pip install django 命令 , 如 图 14-1 所 示 , 安装 最 新 的 Django 


ss 
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版 本 。 截 至 本 书写 作 时 ，Dijango 的 最 新 版 本 为 2.1.5。 
如 果 要 安装 指定 版 本 的 Django， 如 1.11 版 本 ， 安 装 命令 如 下 


pip mstall djaneo—1.11 
GE 管理 品 : 萨 寺 捉 韦 诗 - pip3 install d jango = 口 J \ 
Microsoft Windows 版 本 10.0. 17134. 523] ~| 


(cy 2018 Microsoft Corporation。 保 留 所 有 权利 . | 


C: \WINDOWS\system32>pip3 install django 
Collecting django . ; 

Downloadins https://files. i Org: 0 507078a42b4egbedb94efd3e0278c0eb71650ed9672cd 
0 轴 症 证 而 辐 国庆 症 而 硬 7Y3-none-any. whl (7. 3 


100% | | |||||1Iil 区 国 加 加 轴 业 加 加 即 副 娄 攻 区 蜂 因 因 区 晤 浊 7. 3MB 205kB/s 
Collecting pytz (from django) 
Downloading https: /files. 0 Org ‘packages/61/28/ 1d3920e4d1d50b19bc5d24398af7cd85ccyb9a75ad49 
0570d5a30c5762 2d34/pytz-2018.9 v3—none—any. wh] (510kB) 
100“ 曾 面 面 面 砧 证 面 面 面 面 厂 曾 起 订 面 而 面 而 硬 夺 本 面 硬 硬 面 硬 硬 面 面 硬 硬 硬 ;128 1903 。 


Installing collected packages: pytz, djaneo 


图 14-1 安装 最 新 版 本 的 Django 
最 后 配置 环境 变量 ， 将 以 下 几 个 目录 添加 到 系统 环境 变量 中 ， 如 网 14-2 所 示 。 


C.\Proeram Files\Python37\Lib\site-packages\djaneo 


C:\Proeram Files\Python37\Scrpts 
号 入 环 境 变 后 
ChProgram Files\Intel\Intel(R) Management Engine Components\.. ~ 新 建 [NM) 
， es EA Po CaProgram Files [x86NInteNntellR) Management Engine Compo... 
| 环境 计时 ChProgram FilesIntefntel(R) Management Engine Components,.. 坊 辑 (E) 
| CAProgram Files (xB6NMNYVIDIA CorporatiomPhysi\Common 
ystemRootnsystem32 
LENOGNYO 的 用 户 变 量 { 册 whystemRoot% Wt). | 
变量 值 wystemRoot dystem32 MWbem 出 陈 (D) 
i CAUsers\LENOVON mYSTEMROOTNS Ystem32a MWindowsPowershellyl .On 
Path CAProgram Files\P Dnodejs, 
TEMP CAUsers\LENOVO, wTENIROOTINS ystemd2 Openss HH 
TIMP CAUsers\LENOVON, CAProgram Fllen hongoDB\Servervdt.Mbin 上 移 ( 山 
dPrograrm FllesAnacondas 
dProgram FileN\Anaconda™scripts 下 物 (D) 
dA\Program FilesAmacanada3Librarwywbin 
CaProgram Files\Microsoft VS Code\bin 
CaProgram FileN\Python2r 编 辑 朗 本 (T).. 
CaProgram Filen\Pythone NScripts 
ChProgram Files\Python37 | 
系统 变星 (5) CL Re 下 es | 
变量 值 
Comspec CMWINDOWS systi i 
configsetroot CAMWINDOWS\C on 
DriverData CMINndows\ Syster 确定 取消 


NUMBER OF PROCESSORS = 


PRANCFSSONR ARCHITFCTILIREF NADA | 二 1 z | 
新 建 (W).. 副 除 (0 
确定 取消 


图 14-2 添加 环境 变量 
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添加 完毕 后 ， 就 可 以 使 用 Django 的 django-admin.py 命令 新 建 工 程 了 。 
下 面 检查 Django 是 否 安 装 成 功 。 输 入 以 下 命令 进行 检查 ， 如 图 14-3 所 示 。 


>>> Import django 
>>> djaneo.get version( 


C: WINDOWS \System32 "py tho 
python 不 是 内 庚 : 或 外 部 命令 ， 也 不 是 可 运行 的 程序 
或 批 处 理 文件 。 


C:\WINDOWS\system32 pythons 

Python 3.1.1 a <60ececjdba，Dct 20 2018, 14:97: 15) [MSC v.1915 64 bit (AMD64)|] on win32 
Type “help’, “copyright’, "credits” or “ license”for more information. 

2>> import django 

>>> django. get_Vversion 人 

2 

bp 


图 14-3 ”测试 Django 是 否 安 装 成 功 
如 果 输 出 Django 的 版 本 号 ， 就 说 明 安 装 正确 。 


使 用 Django 框架 


正确 安装 Django 框架 后 ， 就 可 以 开始 使 用 Django 框架 了 。 
14.3.1 创建 pyqi 项 目 


使 用 Django 框架 创建 的 项 
所 谓 项 目 ， 可 以 理解 为 网 站 ; ee 则 是 具有 相对 epeety 模 内 或 子 系统 

项 目 和 应 用 有 喻 区 别 ? 应 用 是 专门 做 某 件 事 的 网 络 应 用 程序 ， 比 如 博客 系统 、 公 共 记 录 的 
数据 库 或 是 简单 的 投票 程序 。 项目 则 是 网 站 使 用 的 配置 和 应 用 的 集合 。 项 目 可 以 包含 多 个 应 用 。 
应 用 可 以 被 多 个 项 目 使 用 。 

新 建 Django 项 目的 语法 格式 如 下 


django-admin startproject 项 目 名 称 


例如 ， 以 下 命令 在 当前 目录 下 创建 了 项 目 pyqi: 


django-admin startproject pyql 
使 用 tree 命令 查看 生成 的 目录 树 结果 : 


CAUsers\LandyDesktop>tree pyql 下 
卷 BOOTCAMP 的 文件 夹 PATH 列表 
卷 序 列 号 为 7416-BA3E 
CN\USERS\LANDY\DESKTOP\PYQI 

| managepy 


9 


settings.py 
urls.py 
WSsegLpy 

_ mt py 


以 上 是 创建 项 目的 一 种 方法 。pyqi 子 目录 的 内 容 ， 就 是 所 创建 项 目的 内 容 。 

可 以 把 刚才 创建 的 项 目 删除 ， 即 删除 pyqijpyqi 目录 ， 然 后 尝试 男 外 一 种 创建 项 目的 方法 ， 
请 注意 观察 两 种 方法 的 命令 形式 和 结果 。 创 建 项 目的 第 二 种 方法 如 下 : 

Ci\Users\Landy\Desktop\pyqi=>djaneo-admmn startproject pyqi . 

这 次 在 项 目 名 称 pyqi 的 后 面 有 一 个 空格 ， 然 后 还 有 一 个 句 与 (英文 半角 句号 )， 如 此 也 可 以 
创建 项 目 。 创 建 之 后 ， 仔 细 观 察 目 录 结 构 ， 如 下 所 示 : 


manage.py 

一 pyqi 
settings.py 
urls.py 
WSegLpy 
_ mt py 


至 此 ， 己 经 创建 了 一 个 项 目 ， 也 意味 着 已 经 有 网 站 的 基本 框架 了 。 执 行 以 下 操作 : 
python manage.py runserver 


在 本 书 中 ， 为 了 明确 说 明 目 录 或 文件 的 位 置 ， 以 “./” 表 示 项 目的 根 目 录 ， 比 如 上 和 面 指令 
中 的 manage.py 文件 ， 在 项 目 中 的 位 置 就 是 ./manage.py; 在 子 目录 pyqi 中 看 到 的 urls.py 文件 ， 
则 用 路 径 ./pyqiurls.py 表示 。 

执行 上 述 指令 后 ， 如 果 一 切 正 常 ， 最 终 将 会 看 到 下 面 的 提示 信息 : 


Starting development server at http://127.0.0.1:8000/ 
Quit the server with CtritC 


提示 信息 的 第 一 行 说 明 已 经 启动 了 一 个 服务 ， 可 以 通过 http:/ 127.0.0.1:8000/ 访 问 ， 提示 信 
息 的 第 二 行 说 明了 结束 当前 服务 的 方法 一 一 按 CtrltC 组 合 键 。 

打开 浏览 器 ， 在 地 址 栏 中 输入 http://127.0.0.1:8000/ 或 http://localhost:8000/， 就 会 看 到 如 图 
14-4 所 示 的 结果 。 

网 站 的 成 长 方式 就 是 不 断 增 加 功能 。 在 Django 中， 人们 将 完成 某 个 或 多 个 功能 的 集合 称 为 
“应 用 ”， 所 以 功能 比较 多 的 网 站 常常 是 由 多 个 “应 用 ”组 成 的 ， 后面 可 以 把 注意 力 集中 于 “应 
Ms 
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gs” - 
| 门 Dlango: the Web frame 蕊 
| € 了 CG | localhosts000 
django Vrew release notes for Django 之 
二 
pA 
The install worked successfully! Congratulations! 
YOU are seelng this page because DEBUG= True is in 
our Settings file and you have not contfigured any 
URLs. 
DO | Django Documentation “yi Tutorial: A Polling App 2a Django Community 
Topics, retlerences, & how-to's Get started with Django Connect, get help., of contrib 


图 14-4 运行 中 的 网 站 


14.3.2 ”创建 投票 应 用 polls 
项 目 己 经 创建 好 ， 网 站 也 有 了 ， 接 下 来 实现 网 站 的 具体 功能 。 在 Django 中 ， 人 们 把 这 些 具 
体 的 功能 称 为 “应 用 ”。 
进入 刚才 创建 好 的 项 目 目录 ， 即 manage.py 文件 所 在 的 目录 ， 然 后 执行 下 面 的 代码 : 
python manage.py startapp pols 
django-admin.py startapp polls 


从 上 述 代码 中 可 以 看 出 ， 执 行 上 面 的 语句 之 后 ， 目 录 中 多 了 于 目录 polls。 如 果 看 看 这 时 候 
的 目录 结构 ， 融 会 看 到 polls 子 目录 里 面 已 经 有 默认 的 文件 和 目录 了 ， 如 下 所 示 : 


| 
上 
全 
S 


J 


a a 


3 
号 
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| settings.py 
| urspy 

| wseipy 

| _init py 


-一 _Pycache 
settnes.cpython-37 .pyc 
Urls.cpython-37 .pyc 
Wsel.cpython-37.pyc 
mt .cpython-37.pyc 
polls 就 是 项 目 pyqi 中 新 建 的 一 个 应 用 。 当 新 的 应 用 创建 后 ，Django 就 会 自动 在 这 个 应 用 
中 增加 一 些 文件 。 
以 上 已 经 是 相对 完善 的 网 站 结构 ， 下 面 依次 对 各 个 部 分 进行 简要 说 明 。 


14.3.3 ”项 目的 目录 结构 


创建 项 目 之 后 ， 项 目的 目录 结构 中 各 个 文件 的 作用 如 下 。 
e manage.py: 一 个 命令 行 实用 程序 ， 可 让 你 以 各 种 方式 与 Django 项 目 进 行 交 互 。 
和 pyqi: 项 目的 实际 Python 包 ， 是 需要 用 来 导入 任何 内 容 的 Python 包 名 。 
e init py: 一 个 空 文件 ， 告 诉 Python 这 个 目录 应 该 被 视 为 一 个 Python 包 。 
e settingspy: 里 面 Django 项 目的 设置 与 配置 , Django 设置 会 告诉 开发 人 员 有 关 设 置 如 何 
工作 的 所 有 信息 。 
e urlspy: 这 是 Django 项 目的 URL 声明 。 
e wsqipy: WSGI 兼容 的 Web 服务 器 为 项 目 提供 服务 的 入 口 点 。 


14.3.4 初步 配置 视图 和 urls 
下 面 天 始 编写 第 一 个 视图 。 打 开 polls/views.py， 输 入 以 下 代码 : 
from djaneo.http Import HttpResponse 


def mdex(request): 
Tetuml HttpResponse("Hello. world. You're at the polls mdex.") 
这 是 Django 中 最 简单 的 视图 。 如 果 想 看 效果 ， 需 要 将 一 个 URL 映射 到 它 一 一 这 就 是 需要 
URLconf 的 原因 。 为 了 创建 URLconf， 需 要 在 polls 日 录 里 新 建 urls.py 文件 (polls/urls.py)， 输 入 
如 下 代码 : 


from django.urls Import path 
from . Import views 


urlpatterns = [ 


path(", views.index, name='index'). 
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] 


接 下 来 要 在 根 URLconf 文件 中 指定 创建 的 polls.urls 模块 。 在 pyqiurls py 文件 的 urlpatterns 
列表 里 插入 include0， 代 码 如 下 : 


from danpo.contrib Import admin 
from django.urls import Include. path 


Urlpattems = [ 
path('polls/, mclude( ‘polls.urls")), 
path(admin/, admin.site.urls), 

| 


includeO 人 允许 引用 其 他 URLconf。 每 当 Diango 迪 到 includeO0 时 , 丈 会 截断 与 此 项 匹配 的 URL 
部 分 ， 并 将 剩余 的 字符 串 发 送 到 URLconf 以 做 进一步 处 理 。 

设计 include0 的 理念 是 希望 可 以 即 插 即 用 ， 因 为 投票 应 用 有 自己 的 URLconflpolls/urls.py)， 
可 以 放 在 /polls/、/fun polls/、/content/polls/ 或 其 他 任何 路 径 下 ， 应 用 都 能 够 正常 工作 。 


注意 : 

何 时 使 用 include0? 当 包 括 其 他 URL 模式 时 , 应 该 总 是 使 用 include0, admin.siteurls 例外 。 

把 index 视图 添加 到 URLconf， 运 行 下 面 的 命令 以 验证 是 否 正常 工作 : 

python manage.py runserver 

用 浏览 右 访 问 http://localhost:8000/polls/， 应 该 能 够 看 见 “Hello,world. You’re at the polls 

index.”， 这 是 在 index 视图 中 定义 的 。 

图 数 pathO 有 四 个 参数 ， 两 个 必需 参数 route 和 view， 以 及 两 个 可 选 参 数 kwargs 和 name。 

e route: 用 于 匹配 URL 的 准则 (类 似 正 则 表达 式 )。 当 Dijango 啊 应 一 个 请 求 时 ， 它 会 从 
urlpatterns 的 第 一 项 开始 ， 按 顺序 依次 匹配 列表 中 的 项 ， 直 到 找到 匹配 的 项 。 这 些 准则 
不 会 匹配 GET 和 POST 参数 或 域名 。 例 如 ，URLconf 在 处 理 请 求 
https://www.example.comy/myapp/ 时 ， 会 尝试 匹配 myapp/ ; 处 理 请 求 
https://www.example.com/myapp/?3page=3 时 ， 也 只 会 党 试 匹 配 myapp/。 

e view: 当 Django 找到 匹配 的 准则 时 ， 就 会 调用 这 个 特定 的 视图 函数 ， 并 传 入 一 个 
HttpRequest 对 象 作 为 第 一 个 参数 ， 被 “捕获 ”的 参数 以 关键 字 参 数 的 形式 传 入 。 

e kwargs: 可 以 将 任意 个 关键 字 参 数 作为 一 个 字典 传递 给 目标 视图 函数 。 

e name: 为 URL 取 名 ， 能 在 Django 的 任意 地 方 唯 一 地 引用 ， 尤 其 是 在 模板 中 。 这 个 有 
用 的 特性 允许 只 改 一 个 文件 就 能 全 局 地 修改 某 个 URL 模式 。 


要 在 网 站 开发 中 存储 信息 ， 数 据 库 操作 必 不 可 少 。 本 节 将 建立 数据 库 ， 创 建 第 一 个 模型 ， 
并 使 用 Django 提供 的 自动 生成 的 管理 页 面 。 
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14.4.1 为 pyqi 项 目 配置 数据 库 


打开 pyqysettings.py 配置 文件 ， 里 面包 含 Django 项 目 设 置 的 Python 模块 ， 使 用 SQLite 作 
为 默认 数据 库 。 如 果 不 熟 悉数 据 库 ， 或 者 只 是 想 尝 试 Django， 这 是 最 简单 的 选择 。Python 内 置 
了 SQLite， 所 以 无 须 安 装 额 外 东西 即 可 使 用 。 当 开始 一 个 真正 的 项 目 时 ， 开 发 人 员 可 能 更 倾 回 
使 用 一 个 更 具 扩 展 性 的 数据 库 , 例如 PostgreSQL,， 以 避免 中 途 切 换 数 据 库 这 个 令 人 头疼 的 问题 。 
这 种 情况 需要 安装 合适 的 数据 库 绑 定 , 然后 改变 设置 文件 中 DAIABASES 'default 项 目 中 的 一 些 
键 值 ， 例 如 ENGINE 和 NAME。 

e ENGINE: 可 选 值 , 可 取 值 包括 django.db.backends.sqlite3、django.db.backends.posteresql、 
django.db.backends.mysql、django.db.backends.oracle 等 。 

e NAME: 数据 库 的 名 称 。 如 果 使 用 的 是 SQLite， 数 据 库 将 是 本 地 计算 机 上 的 一 个 文件 ， 
NAME 应 该 是 这 个 文件 的 绝对 路 径 ， 包 括 文 件 名 。 默 认 值 
os.path.join(BASE_DIR,'db.sqlite3") 将 会 把 数据 库 文件 存储 在 项 目的 根 日 录 下 。 

如 果 不 使 用 SQLite， 则 必须 添加 一 些 额外 设置 ， 比 如 USER、PASSWORD、HOST 等 。 

如 果 使 用 的 是 其 他 数据 库 ， 需 要 在 使 用 前 创建 好 数据 库 。 可 以 通过 在 数据 库 的 交互 式 命令 

行 中 使 用 CREATE DATABASE database name 命令 来 创建 数据 库 。 
另外 ， 还 要 确保 数据 库 用 户 中 提供 pyqi/settings.py 的 具有 CREATE DATABASE 权限 。 这 
使 得 上 自动 创建 的 测试 数据 库 能 被 以 后 的 教程 使 用 。 

如 果 使 用 SQLite， 那 么 不 需要 在 使 用 前 做 任何 事 一 一 数据 库 会 在 需要 的 时 候 自 动 创建 。 

编辑 pyqisettings.py 文件 前 ， 先 设置 时 区 TIME _ ZONE。 

此 外 , 关注 一 下 文件 头 部 的 INSTALLED APPS 设置 项 ,这 里 包括 项 目 中 启用 的 所 有 Django 

应 用 。 应 用 能 在 多 个 项 目 中 使 用 ， 也 可 以 打包 并 发 布 ， 让 别人 使 用 。 
通常 ，INSTALLED APPS 默认 包括 Django 目 市 的 以 下 应 用 。 

e djaneo.contrib.admin: 管理 员 站 点 。 

django.contrib.auth: 认证 授权 系统 。 
django.contrib.contenttypes: 内 容 类 型 框架 。 
django.contrib.sessions: 会 话 框架 。 
django.contrib messages: 消息 框架 。 
django.contrib.staticfiles: 管理 静态 文件 的 框架 。 
这 些 应 用 被 默认 启用 是 为 了 给 常规 项 目 提供 方便 。 
默认 启用 的 某 些 应 用 需要 全 少 一 个 数据 表 ， 所 以 ， 在 使 用 它们 之 前 需要 在 数据 库 中 创建 一 
些 表 。 请 执行 以 下 命令 : 


python manage.py makemierations 

python manage.py mierate 

第 一 条 命令 生成 迁移 文件 ， 第 二 条 命令 检查 INSTALLED APPS 设置 ， 为 其 中 的 每 个 应 用 
创建 再 要 的 数据 表 ， 全 于 具体 会 创建 什么 ， 取 诀 于 pyqi/settings.py 设置 文件 和 每 个 应 用 的 数据 
库 迁 移 文 件 (我 们 稍 后 会 介绍 )。 第 一 个 节令 执行 的 每 个 迁移 操作 都 会 在 终 峭 显示 出 来 。 
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注意 : 

就 像 之 前 说 的 ， 为 了 方便 大 多 数 项 目 ，Dijango 默认 激活 了 一 些 应 用 ， 但 并 不 是 任何 情况 下 
都 需要 它们 。 如 果 不 需要 某 个 或 某 些 应 用 ， 可 以 在 运行 migrate 命令 前 毫 无 顾虑 地 在 
INSTALLED APPS 中 注释 或 删除 它们 。migrate 命令 只 会 为 INSTALLED APPS 中 声明 的 应 用 
进行 数据 库 迁 移 。 


14.4.2 ”为 polls 应 用 创建 模型 


在 Django 里 写 数 据 库 驱 动 的 Web 应 用 的 第 一 步 是 定义 模型 ， 也 就 是 数据 库 结 构 设 计 和 附 
加 的 其 他 元 数据 。 

模型 是 真实 数据 的 简单 、 明 确 的 描述 ， 包 含 为 存储 数据 所 需要 的 字段 和 行为 。 目 标 是 内需 
要 定义 数据 模型 ， 然 后 目 动 从 模型 生成 数据 表 。Diango 的 迁移 代码 是 由 模型 文件 目 动 生成 的 ， 
本 质 上 只 是 历史 记录 ，Dijango 可 以 用 来 进行 数据 库 的 滚动 更 新 ， 通 过 这 种 方式 使 得 能 够 和 当前 
的 模型 匹配 。 

使 用 python manage.py startapp polls 创建 投票 应 用 。 在 投票 应 用 中 创建 两 个 模型 : Question 
和 Choice。 其 中 ，Question 模型 包括 问题 摘 述 (question texb 和 人 发布 时 间 (pub_date)。Choice 模型 
包含 选项 摘 述 (choice tex 人 和 当前 得 票数 (votes)。 

打开 polls/models.py 文件 ， 输 入 以 下 代码 ， 创 建 Question 和 Choice 模型 : 


polls/models.py 
from django.db Import models 


class Question(models.Model): 
question text = models.CharField(max length=200) 
pub date = models.DateTimeField( date published') 


class Choice(models.Model): 
question = models.ForelienKey(Question, on delete=models.CASCADE,) 
choice text = models.CharField(max lenegth=200) 
votes = models. IntegerField(detault—0) 
以 上 代码 中 ， 定 义 模型 时 ， 每 个 模型 继承 于 django.db.models.Model， 其 中 有 一 些 类 变量 ， 
它们 都 表示 模型 里 的 数据 库 字段 。 
每 个 字段 都 是 Field 类 的 实例 。 比 如 ， 字 符 字 段 被 表示 为 CharField， 日 期 时 间 字 段 被 表示 
为 DateTimeField。 这 将 告诉 Django 每 个 字段 要 处 理 的 数据 类 型 。 
每 个 Field 实例 变量 的 名 字 ( 例 如 ，question text 或 pub date) 也 是 字段 名 ， 所 以 最 好 使 用 友 
好 的 格式 。 开 发 人 员 将 会 在 Python 代码 里 使 用 它们 ， 而 数据 库 会 将 它们 作为 列 名 。 
可 以 使 用 可 选 的 选项 来 为 Field 实例 变量 定义 人 类 可 读 的 名 字 。 如 果 茶 个 字段 没有 提供 名 
字 ，Django 将 会 使 用 对 机 器 友好 的 名 字 ， 也 惑 是 变量 名 。 上 面 的 例子 只 为 Question.pub_date 定 
义 了 对 人 类 友好 的 名 字 。 对 于 其 他 字段 ， 机 器 友好 名 也 会 被 作为 人 类 友好 名 使 用 。 
定义 某 些 Field 实例 需要 参数 。 例 如 CharField 需要 max length 参数 ， 这 个 参数 不 仅 用 来 定 
义 数据 库 结 构 ， 也 用 于 验证 数据 ， 稍 后 将 会 看 到 这 方面 的 内 容 。 
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Field 实例 也 能 够 接收 多 个 可 选 参 数 ， 在 上 面 的 例子 中 ， 将 votes 的 default( 也 就 是 默认 值 ) 
设 为 0。 

注意 ， 上 面 的 代码 使 用 ForeignKey 定义 了 一 个 天 系 。 这 将 告诉 Django， 将 每 个 Choice 对 
象 都 关联 到 一 Question 对 象 。Django 支持 所 有 常用 的 数据 库 关 系 : 多 对 一 、 多 对 多 和 一 对 一 。 


14.4.3 ”为 polls 应 用 激活 模型 


前 面 创建 模型 的 代码 给 了 Django 很 多 信息 ， 通 过 这 些 信 息 ，Dijango 可 以 为 这 个 应 用 创建 
数据 库 模 式 ( 生 成 create table 语句 ); 创建 可 以 与 Question 和 Choice 对 象 进行 交互 的 Python DB 
API, 

创建 模型 后 ， 得 把 polls 应 用 安装 到 项 目 里 。 在 配置 文件 settings.py 的 INSTALLED APPS 
中 添加 设置 。 因 为 PollsConfig 类 与 在 文件 polls/appspy 中 ， 所 以 它 的 点 式 路 径 是 
polls.apps.PollsConfig。 因 此 ， 在 文件 pyqi/settings.py 中 ， 为 INSTALLED APPS 子 项 添加 点 式 
路 径 : 


pyqlsettmgspy 

INSTALLED APPS =[ 
‘polls.apps.PollsConfig.. 
‘django.contrib.admm.. 
‘djaneo.contrb.auth' 
'django.contrb.contenttypes,', 
diango.contnb.sesslons . 
‘django.contrib.messages,. 
‘djanego.contrib.statictiles' 

| 

添加 后 ， 项 目 束 将 polls 应 用 包含 进去 了 。 接 看 运行 如 下 命令 : 

python manage.py makemierations polls 

将 会 有 类 似 于 下 面 的 输出 : 

Migrations for ‘polls": 

polls\merations\000] mitial.py 

- Create model Choice 


- Create model Question 
- Add field question to choice 


然后 执行 以 下 命令 ， 更 新 到 数据 表 中 : 
python manage.py migrate 0001 
输出 如 下 : 
Operations to perform: 
Apply all migrations: polls 


Running mierations: 
Applyme polls.0001 mitial... OK 
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通过 运行 make migrations 命令 , Django 会 检测 到 模型 文件 发 生 修改 , 并 且 把 修改 的 部 分 存 
储 为 一 次 迁移 。 

迁移 是 Django 对 于 模型 定义 (也 就 是 数据 库 结构 ) 所 发 生变 化 的 存储 形式 ， 它 们 其 实 也 只 是 
磁盘 上 的 一 些 文件 。 模 型 的 迁移 数据 被 存储 在 polls/migrations/0001 initial.py 里 。 

Django 中 自动 执行 数据 库 迁 移 并 同步 管理 数据 库 结构 的 命令 是 migrate。 首 先 看 看 迁移 命令 
会 执行 哪些 SQL 语句 。sqlmigrate 命令 接收 迁移 的 名 称 ， 然 后 返回 对 应 的 SQL: 


python manage.py sqlmierate polls 0001 
输出 结果 如 下 : 


BEGIN.; 


-- 创建 Choice 模型 


create table "polls choice" ("1d" mteger NOT NULL PRIMARY KEY AUTOINCREMENT., "choice text" 
varchar(200) NOT NULL. "votes" nteger NOT NULL): 


- 创建 Question 模型 


create table "polls queston ("1d" integer NOT NULL PRIMARY KEY AUTOINCREMENT., "question text" 
varchar(200) NOT NULL., "pub date" datetme NOT NULL): 


— Add field question to choice 


alter table "polls choice" RENAME TO "polls choice old": 

create table "polls choice" ("1d" mteger NOT NULL PRIMARY KEY AUTOINCREMENT. choice text" 
varchar(200) NOT NULL. "votes" mteger NOT NULL. "question 1d" mteger NOT NULL REFERENCES 
"polls question" ("1d") DEFERRABLE INITIALLY DEFERRED): 

Insert mto "polls cholce" ("1d", "choice text", "votes", "question 1d") select "1d", "choice text", "votes", NULL 
from "polls cholce old": 

drop table "polls choice old": 

create Index "polls choice question 1d cSb4b260" on "polls choice" ("question 1d"): 

comimit: 


此 处 输出 的 内 容 和 使 用 的 数据 库 有 关 ， 上 面 的 输出 示例 使 用 的 是 SQLite。 

数据 库 的 表 名 是 由 应 用 名 (polls) 和 模型 名 的 小 写 形式 (question 和 choice) 连 接 而 来 的 。 如 果 
需要 ， 可 以 目 定 义 此 行为 。 当 模型 没有 指定 主键 时 ， 系 统 会 目 动 创建 。 

轩 认 情况 下 ，Dijango 会 在 外 键 字段 名 后 退 加 字符 串 " id"， 也 可 以 自 定义 。 外 键 天 系 由 
FOREIGN KEY 生成 。 

生成 的 SQL 语句 是 为 所 用 的 数据 库 定制 的 ， 所 以 那些 和 数据 库 有 关 的 字段 类 型 ， 比 如 
auto increment(MySQL),、 serial(PostereSQL) 和 A integer primary key autoincrement(SQLite), Django 
会 目 动 处 理 。 那 些 和 引号 相关 的 事情 , 例如， 是 使 用 单 引号 还 是 双 引 号 ， 也 一 样 会 被 目 动 处 理 。 

这 个 sqlmigrate 命令 并 没有 真正 在 数据 库 中 执行 迁移 ， 而 只 是 把 命令 输出 到 屏幕 上 ， 让 开 
发 人 员 看 看 Django 认为 需要 执行 哪些 SQL 语句 。 这 在 开发 人 员 或 DBA 想 看 Django 到 底 准 备 
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做 什么 时 会 很 有 用 。 可 以 运行 python manage.py check 命令 来 检查 项 目 中 的 问题 , 在 检查 过 程 中 
不 会 对 数据 库 进 行 任 何 操作 。 
再 次 运行 migrate 命令 ， 在 数据 库 里 创建 新 定义 的 模型 的 数据 表 : 


python manage.py mierate 
Operations to perform: 

Apply al mierations: admn. auth. contenttypes. polls. sesslons 
Runnims mierations: 

Rendermg model states... DONE 

Applyme polls.000] Initial. OK 


misrate 命令 选中 所 有 还 没有 执行 过 的 迁移 (Django 通过 在 数据 库 中 创建 特殊 的 表 
django_migrations 来 跟踪 执行 过 哪些 迁移 ) 并 应 用 到 数据 库 上 ， 也 天 是 将 对 模型 的 更 改 同 步 到 数 
据 库 结构 上 。 

迁移 是 非常 强大 的 功能 ， 可 以 在 开发 过 程 中 持续 地 改变 数据 库 结 构 而 不 需要 重新 删除 和 创 
建 表 ， 专 注 于 使 数据 库 平 滑 升级 而 不 会 丢失 数据 。 

总 结 一 下 ， 改 变 模型 需要 二 步 : 

(1) 编辑 models.py 文件 ， 改 变 模型 。 

(2) 运行 python manage.py makemierations， 为 模型 的 改变 生成 迁移 文件 。 

(3) 运行 python manage.py migrate 来 应 用 数据 库 迁 移 。 

数据 库 迁 移 被 分 解 成 生成 和 应 用 两 个 命令 ， 这 是 为 了 能 够 在 代码 控制 系统 中 提交 迁移 数据 
并 使 之 能 在 多 个 应 用 中 使 用 。 这 不 仪 会 让 开发 更 加 简单 ， 也 会 给 别 的 开发 人 员 和 生产 环境 中 的 
使 用 带 来 方便 。 


14.4.4 测试 生成 的 模型 API 


现在 进入 交互 式 Python 命令 行 ， 尝 试 Django 通过 模型 创建 的 各 种 API。 通 过 以 下 命令 打 
开 Python 命令 行 : 


python manage.py shell 
当成 功 进入 命令 行 后 ， 下 面 来 试 试 DB API: 


>>> fom polls.models import Choice, Question # 导入 创建 的 模型 
>>> Question.objects.all(O 

<QueIySet [> 

# 创建 问题 

>>> from django.utils Import timezone 

>>> q = Question(question text="Whats new?", pub_date=timezone.now()) 
# 保存 模型 对 象 到 数据 库 

>>> q.save() 

# 得 看 对 象 id 

>>> q.1d 

1 

# 访问 值 
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>>> q.question text 

"Whats new?" 

>>> q.pub date 

datetime.datetme(2012., 2. 26. 13. 0, 0, 775217. tzmfo=<UTC>) 
# 修改 对 象 的 属性 值 

>>> q.question text= "What's up?" 

>>> q.savel() 

# 使 用 objects.all0 显 示 所 有 的 问题 

>>> Question.objects.all(O 

<QuerySset [<Question: Question object (1)> 上 = 


从 输出 结果 可 以 看 出 , <Question: Question object (1D)> 对 于 了 解 这 个 对 象 的 细节 没什么 帮助 。 
下 面 通过 编辑 Question 模型 的 代码 (位 于 polls/models.py 中 ) 来 修复 这 个 问题 。 给 Question 和 
Choice 模型 增加 ”stt 0 方法 。 


from djanego.db Import models 


class Question(models.Model): 
HH 
def str (self): 
return self.question text 


class Choice(models.Model): 
和 
def str (self): 
Tetum seltcholce text 


给 模型 增加 str 0) 方法 是 很 重要 的 ， 这 不 仅 能 为 在 命令 行 中 使 用 带 来 方便 ，Dijango 自动 
生成 的 admin 里 也 使 用 这 个 方法 来 表示 对 象 。 
注意 ， 这 些 都 是 常规 的 Python 方法 。 下 面 添加 自 定义 方法 ; 


polls/models.py 
import datetime 


from django.db Import models 
from django.utils 1mport tmezone 


class Question(models.Model): 
def was published recently(self): 
return seltpub date >= timezone.now() - datetime.timedelta(days=1) 
新 加 入 的 import datetime 和 from django.utils import timezone， 分 别 导 入 了 Python 的 标准 模 
块 datetime 和 Dijango 中 与 时 区 相关 的 django.utils.timezone 工具 模块 。 
保存 文件 ， 然 后 通过 python manage.py shell 命令 ， 再 次 打开 Python 交互 式 命令 行 : 


>>> from polls.models Import Choice, Question 
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>>> Question.objects.all() 

<QuerySet [<Question Whats up?>]> 

>>> Question.objects.filter(1d=1) 

<QuerySet [<Question Whats up?> 上 > 

>>> Question.objects.fllter(question text StartswWlth 一 What') 
<QuerySet [<Question: Whats Up?> 上 > 

>>> from django.utils Import tmezone 

>>> cUITent year = timezone.now().year 

>>> Question.objects.get(pub date year=current year) 
<Question: Whats up?> 

# 访问 不 存在 的 这 将 报错 

>>> Question.objects.get(1d=2) 

Traceback (most recent call last): 


DoesNotExist: Question matching query does not exist. 
# 通过 主键 访问 记录 

>>> Question.objects.get(pk—=1) 

<Question: Whats up?> 


# 确保 我 们 的 目 定义 方法 工作 正和 

>>> | = Question.objects.get(pk=1) 

>>> q.was_ published recently() 

Trmue 

>>> q = Question.objects.get(pk=1) 

>>> q.choice setallO 

<QuerySet 由 > 

# 创建 三 个 选项 

>>> gcholce setcreate(cholce text—=Not much', votes—0) 

<Choice: Not much> 

>>> dcholce set.create(choice text TIhe sky', votes=0) 

<Choice: The sky> 

>>>C€=q.choice set.create(choice text=Just hackine agaln', votes—0) 
>>> Cc.question 

<Question: Whats up?> 

>>> q.choice setall0 

<QuerySset [<Choice: Not much>, <Choice: The sky>. <Choice: Just hackmeg agam>|> 
>>> q.choice set.count() 

3 

>>> Choice.objects.filter(question pub date year=current year) 
<QuerySet [<Choice: Not much>, <Choice: The sky>., <Choice: Just hackime agam>|> 


>>> C= dq.choice set.filter(choice text startswith=Just hackine’) 
>>> c.delete() 
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14.4.5 ”使 用 Django 管理 界面 

为 员工 或 客户 生成 用 于 添加 、 修 改 和 删除 内 容 的 后 台 是 一 项 缺乏 创造 性 且 乏 味 的 工作 。 因 
此 ，Diango 全 目 动 地 根据 模型 创建 后 台 界 面 。 

Django 产生 于 公众 页 面 和 内 容 发 布 者 页 面 完 全 分 离 的 新 闻 类 站 点 的 开发 过 程 中 。 站 点 管理 
人 员 使 用 管理 系统 来 添加 新 闻 、 事件 和 体育 资讯 等 , 添加 的 这 些 内 容 显示 在 公众 页 面 上 。 Django 
通过 为 站 点 管理 人 员 创 建 统 一 的 内 容 编 辑 界面 解决 了 这 个 问题 。 

管理 界面 不 是 为 网 站 的 访问 者 ， 而 是 为 管理 者 准备 的 。 

1. 创建 管理 员 账 号 

首先 ， 创 建 能 登录 管理 界面 的 用 户 ， 个 令 如 下 : 

python manage.py createsuperuser 

输入 想 要 使 用 的 用 户 名 ， 然 后 按 下 回 车 键 : 

Usemame: admin 

然后 提示 输入 想 要 使 用 的 邮件 地 址 : 

Emall address: admin(Vexample.com 

最 后 是 输入 密码 。 这 里 会 被 要 求 输入 两 次 密码 ， 输 入 第 二 次 的 目的 是 确认 第 一 次 输入 的 确 
实 是 想 要 的 密码 。 

Password: 求 吾 求 来 刺 吾 求 束 可 求 

Password (agam): 站 尿素 冰 玉 六 玉环 六 

Superuser created successfully. 

2. 局 动 服务 器 

Django 管理 界面 默认 就 是 局 用 的 。 下 面 局 动 服务 器 ， 看 看 它 到 压 是 什么 样 的 : 

python manage.py runserver 


打开 浏览 器 ， 转 到 本 地 域名 的 wadmin/" 目 录 ， 比 如 http://127.0.0.1:8000/admin/， 应 该 会 看 见 
如 图 14-5 所 示 的 管理 员 登 录 界 面 。 


Django administration 


Usernarme: 


Password: 


a | 

BA 
| 上 风骨 
-一 二 < 
ee 


图 14-5 管理 员 登 录 界 面 
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3. 站 点 管理 表面 


使 用 前 面 创建 的 超级 用 户 登 录 管 理 员 界面 ， 单 击 Log in 按钮 后 ， 将 会 看 到 站 点 管理 界面 的 
索引 页 ， 如 图 14-6 所 示 。 


Dja IIUO 9 dm | 门 IstratIon WELGCOME, ADMIN. VIEW SITE / CHANGE PASSWORD / LOG QUT 


Site administration 


AUTHENTICATION AND AUTHORIZATION 


Recent Actions 
Groups 十 Add 六 Change 


Users TAdd 7 Change My Actions 


None available 


图 14-6 索引 页 


在 这 里 可 以 看 到 几 种 可 编辑 的 内 容 : 组 和 用 户 。 它 们 是 由 django.contrib.auth 提供 的 ， 这 是 
Dijango 开发 的 认证 框架 。 


4. 向 站 点 管理 界面 中 加 入 Question 和 Choice 模型 


在 索引 页 中 ， 我 们 只 看 到 Django 框架 本 身 目 带 的 用 户 组 Group 和 用 户 表 Users。 那 么 ， 可 
以 把 创建 的 模型 添加 到 站 点 管理 界面 中 进行 管理 吗 ? 当然 可 以 。 

只 需要 做 一 件 事 : 告诉 站 点 管理 界面 ,Question 对象 需要 被 管理 。 打开 polls/admin py 文件 ， 
如 下 编辑 : 


pollsadmimpy 

from djaneo.contrib Import admm 
from .models Import Question 
admun.site.register(Question) 


在 确保 服务 开局 的 情况 下 ， 刷 新 站 点 管理 界面 ， 如 图 14-7 所 示 。 


Slte administration 


AUTHENTICATION AND AUTHORIZATION 
Recent Actions 
rau 


Add ”Change 


中 Add 本 Change My Aetions 


None available 


图 14-7 添加 的 Question 模型 


单 击 Questions， 将 会 看 到 Question 对 象 的 变化 列表 。 这 个 界面 会 显示 所 有 数据 库 里 的 
Question 对 象 ， 可 以 对 它们 进行 修改 ， 如 图 14-8 所 示 。 
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Home: Polls DOuestions 


Select question to change 


图 14-8 ”Question 对 象 
单 击 “What's up?” 即 可 编辑 这 个 Question 对 象 ， 如 图 14-9 所 示 。 


Date: 219-02-13 | Today 扣 


Time: :03:42-04 Haw 


图 14-9 编辑 Question 对 象 


图 14-9 中 的 表单 是 从 Question 模型 自动 生成 的 。 不 同 的 字段 类 型 (日 期 时 间 字 段 
DateTimeField、 字 符 字 7 段 CharField) 会 生成 对 应 的 HIML 输入 控件 。 每 个 类 型 的 字段 都 知道 该 
如 何在 管理 界面 中 显示 自己 。 

每 个 日 期 时 间 字 段 DateTimeField 都 有 用 JavaScript 编写 的 快捷 按钮 。 日 期 有 转 到 今天 
(Today) 的 快捷 按钮 和 弹出 式 日 历 界面 。 时 间 有 设 为 现在 (Now) 的 快捷 按钮 和 用 于 列 出 常用 时 间 
的 弹出 式 列 表 。 

图 14-9 的 底部 提供 了 以 下 几 个 选项 。 

e 保存 (SAVE): 保存 所 做 的 修改 ， 然 后 返回 对 象 列表 。 

e 你 存 并 继续 编辑 (Save and continue editing): 保存 所 做 的 修改 , 然后 重新 载 入 当前 对 象 的 


修改 界面 。 
e 保存 并 新 增 (Save and add another): 保存 所 做 的 修改 ， 然 后 添加 一 个 新 的 空 对 象 并 载 入 
修改 界面 。 


e 市 除 (Delete)， 显示 确认 删除 界面 。 

如 果 这 里 显示 的 “发 布 日 期 ”(Date published) 和 前 面 创建 它们 的 时 间 不 一 致 ， 那 么 意味 着 
可 能 没有 正确 设置 TIME _ ZONE。 改变 设置 ， 然 后 重新 载 入 界面 看 看 是 否 显示 了 正确 的 值 。 

可 通过 单 击 “今天 ”(Today) 和 “现在 ”(Now) 按 钮 改变 “发 布 日 期 ”(Date published)， 然 后 
单 击 “保存 并 继续 编辑 ”(Save and add another) 按 钮 ， 接 着 点 击 右 上 和 角 的 “历史 ”(HISTORY) 
按钮 , 将 看 到 一 个 列 出 了 所 有 通过 Django 管理 界面 对 当前 对 象 进行 改变 的 界面 , 其 中 列 出 了 时 
间 惟 和 进行 修改 操作 的 用 户 名 ， 如 网 14-10 所 示 。 
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Home ; Polls ; Questions ; What's new?Ah? ; History 


Change history: What s new?Ah? 
DATE/TIME USER ACTION 


Feb. 16, 2019, 3:40 p.m. admin Changed question_text. 


图 14-10 ”修改 历史 记录 


接着 使 用 同样 的 方法 将 Choice 模型 也 添加 到 站 点 管理 界面 中 。 
熟悉 了 DB API 之后， 下 面 为 投票 应 用 添加 更 多 视图 。 


本 节 将 继续 以 投票 应 用 polls 为 例 ， 并 且 专 注 于 如 何 创 建 公 用 界面 一 一 又 称 为 “视图 ”。 

Django 中 的 视图 是 一 类 有 具有 相同 功能 和 模板 的 网 页 的 集合 。 比 如 ， 在 博客 应 用 中 ， 可 能 会 
创建 如 下 几 个 视图 。 

博客 首页 一 一 展示 最 近 的 几 项 内 容 。 

e 内容“ 详情 ”页 一 一 详细 展示 某 项 内 容 。 

e 以 年 为 单位 的 归档 页 一 一 展示 选中 的 年 份 里 各 个 月 份 创建 的 内 容 。 
e ”以 月 为 单位 的 归档 页 一 一 展示 选中 的 月 份 里 每 天 创建 的 内 容 。 
者 
毒 


以 天 为 单位 的 归档 页 一 一 展示 选中 日 子 里 创建 的 所 有 内 容 。 
评论 处 理 右 一 一 用 于 啊 应 为 一 项 内 容 添 加 评论 的 操作 。 
而 在 投票 应 用 中 ， 需 要 下 列 几 个 视图 。 
e 问题 索引 页 一 一 展示 最 近 的 几 个 投票 问题 。 
e 问题 详情 页 一 一 展示 茶 个 投票 问题 和 不 市 结果 的 选项 列表 。 
e 问题 结果 页 一 一 展示 茶 个 投票 问题 的 结果 。 
e 投票 处 理 器 一 一 用 于 啊 应 用 户 为 条 个 问题 的 特定 选项 投票 的 操作 。 
在 Django 中 , 网 页 和 其 他 内 容 都 从 视图 派生 而 来 。 视图 表现 为 简单 的 Python 函数 。Django 
将 会 根据 用 户 请 求 的 URL 来 选择 使 用 哪个 视图 (更 准确 地 说 , 是 根据 URL 中 域名 之 后 的 部 分 )。 
在 上 网 时 ， 我 们 经 常 看 到 这 样 的 URL: 
ME2/Sites/dirmod.asp?sid=&type=gené:mod=Coret+Pages&gid=A6CD4967199A42D9B65B1B 
Django 里 的 URL 规则 要 比 这 优雅 很 多 。URL 模式 定义 了 某 种 URL 的 基本 格式 ， 例 如 ， 
/newsarchive/<year>/<month>/。 
为 了 将 URL 和 视图 关联 起 来 ，Django 使 用 URLconf 来 配置 。URLconf 将 URL 模式 映射 
到 视图 。 
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14.5.1 编写 视图 


前 面 编写 了 一 个 视图 ， 这 里 编写 查看 问题 详情 视图 detail、 结 果 视 图 results 以 及 投票 视图 
vote。 首 先 问 polls/views.py 里 添加 这 些 视图 ， 这 些 视 图 有 一 些 不 同 ， 因 为 它们 接收 参数 。 程 序 
如 下 : 


def detall(request, question 1d): 
Tetuml HttpResponse("YouTre lookimne at question %s." % question 1d) 


det results(request, question 1d): 
response = "YOUTe ljookmsg at the results of question %s." 
Tetuml HttpResponse(response % question 1d) 


det vote(request, question 1d): 
Tetum HttpResponse("You'Te voting on question %s." % question 1d) 


把 这 些 新 视图 添 加 到 polls.urls 模块 里 ， 只 需要 添加 几 个 url0 函 数 调 用 就 行 : 


from django.urls Import path 
from . 1mport views 


Urlpattems = [ 
# ex: /polls/ 
path(", views.mdex, name— ndex'"). 
# ex: /polls/$/ 
path('<nt:question 1d=/, Views.detall name='detall'), 
# ex: /polls/S/results/ 
path('<mt:question 1d=/results/, views.results, name~=—results'). 
# ex: /polls/$/vote/ 
path('<nt:question 1d>/vote/, Views.vote, name 一 vote )， 
] 


然后 刷新 浏览 器 ， 如 果 转 到 "/polls/34/"，Dijango 将 会 运行 detail0 方 法 并 且 展 示 URL 里 提供 
的 问题 DD。 再 试 试 "Wpolls/34/vote/" 和 "/polls/34/vote"， 将 会 看 到 暂时 用 于 占 位 的 结果 视图 和 投票 
视图 。 

当 用 户 请 求 网 站 的 某 一 页 面 时 ， 比 如 "Vpolls/34"，Dijango 将 会 载 入 pyqiurls 模块 ， 因 为 这 
在 配置 项 ROOT_URLCONEF 中 设置 过 了 。 然 后 Django 寻找 名 为 urlpatterns 的 变量 并 且 按 序 匹 
配 上 正则 表达 式 。 在 找到 匹配 项 'polls/ 后 ， 切 掉 匹 配 的 文本 ("polls")， 将 剩余 文本 一 一 "34/" 发 送 至 
'polls.urls' URLconf 做 进一步 处 理 。 在 这 里 ， 剩 余 文 本 匹配 '<int:question id>"， 使 得 Django 以 如 
下 形式 调用 detail0: 


detall(request—<HttpRequest object>, question 1d=34) 


question id=34 由 <int:question id> 匹 配 生 成 。 使 用 人 尖 括 号 “捕获 ”这 部 分 URL， 并 且 以 关 
键 字 参数 的 形式 发 送 给 视图 图 数 。 上 述 字 符 串 的 question id 部 分 定义 了 将 被 用 于 区 分 匹配 模式 
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的 变量 名 ， 而 int 则 是 URL 路 径 ， 转 换 器 决定 了 应 该 以 什么 变量 类 型 匹配 这 部 分 URL 路 径 。 
14.5.2 ”为 视图 添加 模板 


每 个 视图 必须 要 做 的 只 有 两 件 事 : 返回 包含 被 请 求 页 面 内 容 的 HttpResponse 对 象 ; 或 者 抛 
出 异常 ， 比 如 Http404。 

视图 可 以 从 数据 库 里 读 取 记录 、 使 用 模板 引擎 (可 以 是 Django 目 带 的 ， 也 可 以 是 其 他 第 三 
方 的 )、 生 成 PDF 文件 、 输 出 XML、 创建 ZIP 文件 ， 等 等 。 

Django 只 要 求 返回 的 是 HttpResponse 对 象 或 者 抛 出 异常 。 

因为 Django 上 自 带 的 DB API 很 方便 ， 下 面 尝 试 在 视图 里 使 用 它 。 在 index0 函 数 里 插入 一 些 
新 内 容 ， 让 它 能 展示 数据 库 里 以 发 布 日 期 排序 的 最 近 5 个 投票 问题 ， 以 空格 分 隔 。 在 
polls/views.py 文件 中 修改 index0 函 数 ( 其 他 函数 不 变 ): 


from django.http mport HttpResponse 
from .models Import Question 


def mndex(request): 
latest question list = Question.objects.order by(-pub date")[:5] 
output=", "Jom([g.question text for q m jatest question list|) 
return HttpResponse(output) 


这 里 有 个 问题 : 页面 的 设计 写 死 在 视图 函数 的 代码 里 。 如 果 想 改变 页 面 的 外 观 ， 需 要 编辑 
Python 代码 。 我 们 需要 使 用 Django 的 模板 系统 ， 只 要 创建 一 个 视图 ， 就 可 以 将 页 面 的 设计 从 
代码 中 分 离 出 来 。 

首先 ， 在 polls 目录 里 创建 templates 子 目 录 。Django 将 会 在 这 个 于 目录 里 查找 模板 文件 。 

项 目的 TEMPLATES 配置 项 描述 了 Django 如 何 载 入 和 演 染 模板 。 默 认 的 设置 文件 设置 了 
DjangoTemplates 后 端 ， 并 将 APP DIRS 设置 成 了 True。 这 一 选项 将 会 让 DjangoTemplates 在 每 
个 INSTALLED APPS 文件 夹 中 寻找 templates 子 目 录 。 这 就 是 为 什么 尽管 没有 修改 DIRS 设置 ， 
Django 也 能 正确 找到 polls 的 模板 位 置 的 原因 。 

在 刚刚 创建 的 templates 子 目 录 里 ， 再 创建 目录 polls， 然 后 在 其 中 新 建文 件 ndexhtml。 换 
句 话 说， 模板 文件 的 路 径 应 该 是 polls/templates/polls/index.html。 因 为 Django 会 寻找 对 应 的 
app_directories， 所 以 只 需要 使 用 polls/index.html 就 可 以 引用 这 一 模板 了 。 

注意 ， 虽 然 可 以 将 模板 文件 直接 放 在 polls/templates 文件 夹 中 (而 不 是 再 建立 polls 子 文件 
夹 )， 但 是 这 样 做 不 太 好 。Django 将 会 选择 第 一 个 匹配 的 模板 文件 ， 如 果 有 一 个 模板 文件 止 好 
和 另 一 个 应 用 中 的 茶 个 模板 文件 重 名 ，Dijango 将 没有 办 法 区 分 它们 。 我 们 需要 帮助 Django 选 
择 正 确 的 模板 ， 了 最 简单 的 方法 融 是 将 其 放 入 各 目的 名 称 空间 中 ， 也 惑 是 把 这 些 模板 放 入 一 个 和 
自身 应 用 重 名 的 子 文件 夹 里 。 

将 下 面 的 代码 输入 刚刚 创建 的 模板 文件 polls/templates/polls/index.html 中 : 

{%0 1{ latest question list 9%0} 

<nl> 
{2%0 for question In latest question list %%} 
<]i><a href="/polls/{ { question.1d }}/"=>1{{ question.question text }}</a></]> 
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{%0 endfor 90} 

<ul> 
{%0 else %o} 

<p>No polls are avallable.</p> 
{%0 endif 9%0} 


然后 ， 更 新 一 下 polls/views.py 里 的 index 视图 来 使 用 模板 : 


from djaneo.http mport HttpResponse 
from djaneo.template mport loader 


from .models Import Question 


def Index(request): 
latest question list = Question.objects.order by(-pub date")[:$] 
template = loader.get template('polls/mdex.html') 
context= { 
‘latest question list': latest question list, 
HttpResponse(template.render(context, request)) 
上 述 代 码 的 作用 是 ， 载 入 polls/index.html 模板 文件 ， 并 且 回 它 传递 一 个 上 下 文 (context)。 
这 个 上 下 文 是 一 个 字典 ， 它 将 模板 内 的 变量 映射 为 Python 对 象 。 
用 浏览 器 访 问 "/polls"， 将 会 看 见 一 个 无 序列 表 ， 里 面 列 出 了 前 面 添加 的 “What’s up ”投票 
问题 ， 链 接 指向 这 个 投票 问题 的 详情 页 。 


14.5.3 ” 泻 染 模板 

载 入 模板 , 填充 上 下 文 , 再 返回 由 它 生 成 的 HttpResponse 对 象 是 一 个 非常 常用 的 操作 流程 。 
于 是 Django 提供 了 快捷 函数 render0， 用 它 来 重 写 mdexO 国 数 : 

from django.shortcuts 1mport render 


from .models Import Question 


def mdex(request): 
latest question list= Question.objects.order by(-pub date")|[:$] 
context = {latest question list: latest question list} 
Tetum render(request, 'polls/Index.html', context) 


注意 ， 这 里 不 再 需要 导入 loader 和 HttpResponse。 如 果 还 有 其 他 图 数 ， 而 detail、results 和 
vote 视图 需要 用 到 ， 就 需要 保持 叶 入 HttpResponse。 


14.5.4 抛 出 Http404 异常 


在 访问 某 个 问题 时 ， 需 要 传 入 question 这， 如 果 传 入 的 question_ id 不 存在 ， 系 统 将 会 抛 出 
异常 。Django 此 时 会 输出 一 堆 默 认 的 报错 信息 ， 这 些 信息 的 体验 非常 不 友好 。 实 际 项 目 中 良好 


的 处 理 方法 是 ， 抛 出 404 异常 ， 并 泻 染 定制 好 的 404 异 币 提示 页 面 。 这 里 来 介绍 如 何 抛 出 404 


现在 处 理 投票 详情 视 医 会 显示 指定 的 投票 问题 的 标题 。 下面 是 polls/views.py 视图 的 
代码 : 

from django.http mport Http404 

from djaneo.shortcuts 1mport render 


from .models 1mport Question 
人 
det detall(request, question 1d): 
try: 
question = Question.objects.eget(pk—question 1d) 
except Question.DoesNotExist: 
ralse Http404("Question does not exist") 
Tetum render(request. 'polls/detail. html'. {'question': question}) 


重新 运行 程序 ， 访 问 detail 视图 时 ， 如 果 与 指定 问题 DD 对 应 的 问题 不 存在 ， 这 个 视图 就 会 
抛 出 Http404 异常 。 


14.5.5 get object or 404() 


尝试 用 get0 函 数 获取 一 个 对 象 ， 如 果 这 个 对 象 不 存在 ， 就 抛 出 Http404 异常 ， 这 也 是 一 个 
普遍 的 流程 。Django 为 此 提供 了 一 个 快捷 函数 ， 下 面 是 修改 后 的 polls/views.py 视图 的 代码 : 


from django.shortcuts 1mport get object or 404. render 


from .models Import Question 
本 过 
det detall(request, question 1d): 
question = Pet object or 404(Question, pk=question 1d) 
Tetum render(request, 'polls/detail .htnl'. fquestion': question}) 
为 什么 这 里 使 用 辅助 函数 get object or 4040 而 不 是 目 己 捕获 ObjectDoesNotExist 异常 呢 ? 
还 有 ， 为 什么 模型 API 不 直接 抛 出 ObjectDoesNotExist 异常 而 是 抛 出 Http404 异常 呢 ? 
因为 这 样 做 会 增加 模型 层 和 视图 层 的 奸 合 性 ,指导 Django 设计 的 最 重要 思想 之 一 丈 是 保证 
松 歼 灯 合 。 一 些 受 控 的 煌 合 将 会 被 包含 在 django.shortcuts 模块 中 。 
还 有 get list or 4040 函 数 ， 工 作 原 理 和 get object or 4040 函 数 一 样 ， 除 了 getO 函 数 被 换 
成 锯 ter0 函 数 ， 如 果 列 表 为 空 的 话 ， 会 抛 出 Http404 异常 。 


14.5.6 ”为 投票 应 用 使 用 模板 


回 过 头 看 看 detail 视图 ， 它 同 模 板 传 递 了 上 下 文 变量 question。 下 面 是 polls/templates/polls/ 
detail.html 模板 里 正式 的 代码 : 


<hl>1{{ question.question text }}</h]1> 
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<Uu> 

{%6 for choice m question.choice set.all %o} 
<]i>{1{ choice.choice text }}</]> 

{%0 endfor 9%0} 

</ul> 


模板 系统 统一 使 用 点 符号 来 访问 变量 的 属性 。 在 示例 {{question.question text}} 中 ， 首 先 
Django 尝试 对 Question 对 象 使 用 字典 查找 ， 也 就 是 使 用 obj.get(s 由 操作 ， 如 果 失 败 了 ， 融 尝试 
属性 查找 (也 就 是 obj.str 操作 )， 但 结果 成 功 了 。 如 果 这 一 操作 也 失败 ， 将 会 尝试 列表 查找 (也 就 
是 obj[int] 操 作 )。 

在 {% for %} 循 环 中 发 生 的 函数 调用 如 下 : question.choice_ set.all 被 解释 为 Python 代码 
question.choice set.all0, 这 将 会 返回 一 个 可 友 代 的 Choice 对 象 ,这 个 Choice 对 象 可 以 在 {% for %} 
标签 内 部 使 用 。 

前 面 在 polls/index.html 里 编写 投票 链接 时 ， 链 接 是 硬 编码 的 : 


<li><a href="/polls/{{ question.id }}/">{1{ question.question text 人 二 aa> 一 > 


这 种 方式 对 于 包含 很 多 应 用 的 项 目 来 说 , 修改 起 来 十 分 困难 。 然 而 , 因为 在 pollsurls 的 url0 
商 数 中 通过 name 参数 为 URL 定义 了 了 名字， 所 以 可 以 使 用 {% url %} 标 签 代 蔡 它 : 


<li><a href—"{% url ‘detall'’ question.id %}">{{ question.question text }}</a></li> 


fo url %} 标 签 的 工作 方式 是 ， 在 polls.urls 模块 的 URL 定义 中 寻找 具有 指定 名 字 的 条 目 。 
可 以 回忆 一 下 ， 有 具有 名 字 "detail 的 URL 是 在 如 下 语句 中 定义 的 : 


path(<mnt:question 1d>/ ViewWs.detall. name='detall'). 


如 果 想 改变 投票 详情 视图 的 URL， 比 如 想 改 成 polls/specifics/12/， 不 用 在 模板 里 修改 任何 
东西 (包括 其 他 模板 )， 只 要 在 polls/urls.py 里 稍微 修改 一 下 就 行 : 


path('specifics/<nt:question 1d=/', Views.detall, name= detal)， 


14.5.7 ”为 URL 名 称 添加 名 称 空 间 

在 真实 的 项 目 中 ， 可 能 会 有 5 个 、10 个 、20 个 甚至 更 多 个 应 用 。Dijango 如 何 分 辩 重 名 的 
URL 呢 ? 举 个 例子 ，polls 应 用 有 detail 视图 ， 可 能 另 一 个 博客 应 用 也 有 同名 的 视图 。 Django 如 
何 知 道 {% url %} 标 签到 底 对 应 哪个 应 用 的 URL 呢 ? 

答案 是 : 在 根 URLconf 中 添加 名 称 空间 。 在 polls/urls.py 文件 中 稍 作 修 改 ， 加 上 app_name 
以 设置 名 称 空间 : 


from django.urls Import path 


”349 


urlpatterns = [ 
path(", views.ndex, name='Index'). 
path(<nt:question 1d>/, views.detall, name='detall'). 
path('<nt:question 1d=/results/. Views.results, name=results'). 
path(<mt:question 1d=/vote/, Vlews.vote, name—vote'). 


] 

现在 ， 编 辑 polls/index.html 文件 ， 将 

<li><a href—"{% ur] "detall’ question.1d %0} "=>{{ question.question text }}</a><1> 
修改 为 指向 具有 名 称 空间 的 详细 视图 : 


<li><a href="{% url polls:detail question.id %}">{{ question.question text }}</a></li> 


本 市 将 继续 编写 投票 应 用 ， 在 投票 应 用 中 引入 表单 技术 ， 介 绍 人 简单 的 表单 处 理 并 且 精 简 代 


码 。 表 单 在 Web 应 用 中 主要 用 来 收集 资料 ， 如 用 户 注册 功能 。 
14.6.1 编写 表单 


下 面 更 新 一 下 前 面 编写 的 投票 详情 页 面 的 模板 polls/templates/polls/detailLhtml， 让 它 包含 一 


个 HTML <form> 元 素 : 


<hl>{{ question.question text }}</h1> 
{% I error message %}<p><strone>1:1 eIror message }}</strone></p>{% endif %} 


<form action=" {% url polls:vote’ question.1d %}" method="post"> 

{%o csIf token %} 

{%0 for choice m question.choice set.all %} 
<Input type= Tadlo" name= "cholce" 1d—"choice{ { forloop.counter }}" value="{{ choice.1d }}" /> 
<label for="choice{ { forloop.counter }}"={1{ choice.chorce text }}</label=<br > 

{%0 endfor 9%01 

<Input type= "submlt' value="Vote" /> 

</form> 


上 面 的 模板 在 问题 的 每 个 选项 前 添加 一 个 单 选 按钮 。 每 个 单 选 按钮 的 value 属性 是 对 应 的 


各 个 选项 的 D; 每 个 单 选 按钮 的 name 是 "choice"。 这 意味 着 ， 当 选中 一 个 单 选 按钮 并 提交 表单 
时 ， 将 发 送 POST 数据 choice=#， 其 中 # 为 所 选中 选项 的 也。 这 是 HIML 表单 的 基本 概念 。 


表单 的 action="{% Url 'polls:vote' question.id %}"，method="post"。 使 用 method="post" 是 非 
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常 重要 的 ， 因 为 提交 表单 的 行为 会 改变 服务 器 端的 数据 。 无 论 何 时 ， 当 需要 创建 改变 服务 器 六 
数据 的 表单 时 ， 使 用 method= "post "。 

forloop.counter 指示 for 标签 已 经 循环 了 多 少 次 。 

由 于 创建 了 一 个 POST 表单 ( 它 具 有 修改 数据 的 作用 ), 因此 需要 小 心 跨 站 请 求 伪造 。Dijango 
拥有 一 项 用 来 防御 系统 的 功能 ， 所 有 针对 内 部 URL 的 POST 表单 都 应 该 使 用 {% csrf token %} 
模板 标签 。 

现在 创建 一 个 Django 视图 来 处 理 提交 的 数据 。 记 住 ， 要 在 投票 应 用 中 创建 一 个 URLconf: 


path(<nt:question 1d>/vote/, views.vote, name 一 vote )， 


另外 还 要 创建 vote0 函 数 的 虚拟 实现 。 下 面 创建 一 个 真实 的 版 本 。 将 下 面 的 代码 添加 到 
polls/views.py 中 : 


from django.http Import HttpResponse, HttpResponseRedirect 
from dango.shortcuts Import get object or 404. render 


from django.urls import reverse 


from .models 1mport Choice, Question 
人 
def vote(request, question 1d): 
question = get object or 404(Question, pk—=question 1d) 
try: 
selected choice = question.choice set.get(pk—request.POSTI'chorce']) 
except (KeyError, Choice.DoesNotExIst): 
# 返回 该 问题 并 显示 详情 页 
Tetum render(request, 'polls/detall html', { 
'question': question. 
'eITor messapge': "You didn't select a choice.", 
}) 
else: 
selected choice.votes += 1 
selected choice.save() 
# 处 理 完毕 后 返回 一 个 HttpResponseRedirect， 避 免 重复 提交 表单 
Tetum HttpResponseRedirect(reverse('polls:results', ares=(question.1d.))) 


request.POST 是 一 个 字典 对 象 ， 可 以 通过 关键 字 的 名 字 获 取 提 交 的 数据 。 这 个 例子 中 ， 
request.POST['choice] 以 字符 串 形式 返回 所 选中 选项 的 有 D。request.POST 的 值 永 远 是 字符 串 。 

注意 ，Django 还 以 同样 方式 提供 了 request.GET 用 于 访问 GET 数据 ， 但 在 代码 中 显 式 地 使 
用 requestPOST， 以 保证 数据 只 能 通过 POST 调用 改动 。 

如 果 在 requestPOST[choice] 数 据 中 没有 提供 选项 , POST 将 引发 KeyError 错误 。 上 面 的 代 
码 检查 KeyError 错误 ， 如 果 没 有 给 出 选项 ， 将 重新 显示 问题 表单 和 错误 信息 。 

在 增加 选项 的 得 票数 之 后 ， 代 码 返 回 HttpResponseRedirect 而 不 是 第 用 的 HttpResponse。 
HttpResponseRedirect 只 接收 一 个 参数 : 用 户 将 要 被 重 定 同 的 URL。 

这 个 例子 中 ， 在 HttpResponseRedirect 的 构造 函数 中 使 用 了 reverse0 函 数 。 这 个 函数 避免 了 
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在 视图 函数 中 硬 编 码 URL， 但 需要 提供 想 要 跳 转 的 视图 的 名 字 ， 以 及 对 应 的 URL 模式 中 需要 
为 视图 提供 的 参数 。 在 本 例 中 ， 使 用 设 定 的 URLconf，reverse0 调 用 将 返回 下 面 这 样 的 字符 串 : 


‘polls/3/results/ 


其 中 3 是 question.id 的 值 。 重 定向 的 URL 将 调用 results 视图 来 显示 最 终 的 页 面 。 
正如 前 面 提 到 的 ,使 用 HttpRequest 对 象 ， 当 有 人 对 问题 进行 投票 后 ，vote 视图 将 请 求 重 定 
向 到 问题 的 结果 界面 。 下 面 来 编写 这 个 视图 : 


#polls/views.py 
from django.shortcuts 1mport get object or 404. render 


def results(request, question 1d): 
question = Pet object or 404(Question, pk=question 1d) 
return render(request, 'polls/results.html', {question': question}) 


这 和 detail 视图 几乎 一 模 一 样 。 唯 一 不 同 的 是 模板 的 名 字 。 现 在 ， 创 建 polls/results.html 
模板 : 


#polls/templates/polls/results.html 
<hl>{{ question.question text }}</h1> 


<ul> 
{% for choice In question.choice set.all %} 
<]i=>{{ choice.choice text }} — {{ choice.votes }} vote{{ choice.voteslpluralize }}</> 
{%0 endfor 9%01 
</ul> 


<a href—="{% url 'polls:detall’ question.1d %}"=Vote again?</a> 


现在 ， 在 浏览 器 中 访问 /polls/1/ 后 为 问题 投票 。 应 该 可 以 看 到 投票 结果 页 面 ,并且 在 每 次 投 
票 之 后 都 会 更 新 。 如 果 提 交 时 没有 选中 任何 选项 ， 将 会 看 到 错误 信息 。 


14.6.2 ” 巡 用 人 钢 图 


detail 和 results 视图 都 很 简单 一 一 并 有 旦 ， 正 像 上 面 提 到 的 那样 ， 存 在 见 余 问题 。 用 来 显示 
投票 列表 的 index 视图 和 它们 类 似 。 

这 些 视图 反映 了 基本 的 Web 开发 中 的 以 下 常见 情况 ， 根据 URL 中 的 参数 从 数据 库 中 获取 
数据 、 载 入 模板 文件 , 然后 返回 泻 染 后 的 模板 。 Django 提供 了 一 种 快捷 方式 , 叫 作 “通用 视图 ”。 

通用 视图 将 常见 的 模式 抽象 化 ， 可 以 在 编写 应 用 时 甚至 不 需要 编写 Python 代码 。 

下 面 将 投票 应 用 转换 成 使 用 通用 视图 ， 这 样 可 以 精简 许多 代码 。 这 里 仅仅 需要 执行 以 下 几 
步 来 完成 转换 ， 这 些 步 骤 如 下 : 

(1) 转换 URLconf。 

(2) 删除 一 些 旧 的 、 不 再 需要 的 视图 。 

(3) 基于 Django 的 过 用 视图 引入 新 的 视图 。 
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为 什么 要 重 构 代码 ? 一 般 来 说 , 当 编 写 Django 应 用 时 , 应 该 先 评 佑 一 下 通用 视图 是 否 可 以 
解决 所 面临 的 问题 ， 应 该 在 一 开始 使 用 ， 而 不 是 进行 到 一 半 时 重 构 代 码 。 


1. 转换 URLconf 
首先 ， 打 开 pollsmurlspy， 修 改 成 如 下 : 


from djanego.urls Import path 
from . 1mport views 


app name = 'polls' 

urlpatterns = [ 
path(", views.IndexView.as view(), name~—index"). 
path(C<=imtpk> views.DetallView.as VIewU, name='detall'), 
path('<mt:pk/results/, views.ResultsView.as View(), Dame=Tesults ), 
path(<mnt:question 1d=/vote/, VIews.vote, name—vote'). 


] 


注意 ， 在 第 二 个 和 第 三 个 匹配 准则 中 ， 路 径 字 符 串 中 匹配 模式 的 名 称 由 <question_ id> 改 为 
<pk>。 


2. 改 民 视图 和 使 用 通用 视图 


下 一 步 ， 将 删除 旧 的 index、detail 和 results 视图 ， 并 用 Django 的 通用 视图 代 兰 。 打 开 
polls/views.py 文件 ， 修 改 成 如 下 : 


from djaneo.http mport HttpResponseRedirect 

from djaneo.shortcuts 1mport get object or 404. render 
from django.urls import reverse 

from djaneo.views 1mport generic 


from .models Import Choice, Question 
class INdex View(generic.ListView): 
template name = 'polls/index.html 
context object name = "latest question list 
det pet queryset(self): 
"返回 最 近 的 个 问题 
return Question.objects.order by(-pub date)[:$] 
class DetallView(generic.DetallView): 
model = Question 
template name = 'polls/detall.html 


class ResultsView(generic.DetallV1iew’): 
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model = Question 
template name = 'polls/results.html 


def vote(request, question 1d): 


pass 
# 没有 任何 修改 时 调用 
这 里 使 用 两 个 通用 视图 : ListView 和 DetailView。 这 两 个 视图 分 别 抽象 了 两 个 概念 : “ 显 


示 对 象 列 表 ” 和 “显示 特定 类 型 对 象 的 详细 信息 页 面 ”。 

每 个 通用 视图 需要 知道 自己 将 作用 于 哪个 模型 ， 这 由 model 属性 提供 。 

DetailView 需要 从 URL 中 捕获 名 为 pk 的 主键 值 , 所 以 , 为 通用 视图 把 question id 改 成 pk。 

默认 情况 下 ， 通 用 视图 DetailView 使 用 名 为 <app name>/<model name> detail.html 的 模板 。 
在 上 述 示例 中 ， 它 将 使 用 polls/question detail.html 模板 。template name 属性 用 来 告诉 Django 
使 用 指定 的 模板 名 字 ， 而 不 是 使 用 目 动 生成 的 默认 名 字 。 这 里 也 为 results 视图 指定 了 
template name 一 一 这 确保 results 和 detail 视图 在 演 染 时 县 有 不 同 的 外 观 ， 即 使 它们 在 后 台 都 是 
同一 个 DetailView。 

类 似 地 ，ListView 使 用 名 为 <app name>/<model name> listhtml 的 默认 模板 ， 使 用 
template name 来 告诉 ListView 使 用 已 经 存在 的 polls/index.html 模板 。 

在 之 前 的 介绍 中 ,提供 模板 文件 时 都 禹 有 包含 question 和 latest_ question list 变量 的 context 
变量 .对 于 DetailView, question 变量 会 自动 提供 一 一 因为 使 用 了 Django 的 Question 模型 ,Django 

能 够 为 ee 变 量 决 定 合适 的 名 字 。 然 而 对 于 ListView, 自动 生成 的 context 变量 是 question list。 

为 了 和 窗 新 这 个 行为 ， 这 里 提供 了 context object name 属性 ， 表 示 想 使 用 latest question list。 作 
heehee 可 以 改变 模板 来 匹配 新 的 context 变量 一 一 这 是 一 种 更 便捷 的 方法 ， 通 知 
Django 使 用 期 望 的 变量 名 。 


本 书 继 续 为 投票 应 用 编写 测试 ， 现 在 需要 加 上 样式 和 图 片 。 

除了 服务 器 端 生 成 的 HIML 以 外 , 投票 应 用 通常 需要 一 些 和 额外 的 文件 一 一 比如 图 片 、 脚 本 
和 样式 表 一 一 以 帮助 泻 染 Web 页 面 。 在 Django 中 ， 这 些 文件 统称 为 “静态 文件 ”。 

对 于 小 项 目 来 说 ， 这 个 问题 没什么 大 不 了 ， 因 为 可 以 把 这 些 静 态 文 件 随 便 放 在 哪里 ， 只 要 
服务 器 程序 能 够 找到 它们 就 行 。 然 而 在 大 项 目 一 一 特别 是 由 好 几 个 应 用 组 成 的 大 项 目 中 ， 处 理 
不 同 应 用 所 需要 的 静态 文件 就 显得 有 点 胀 烦 本 。 

这 就 是 django.contrib.staticfiles 存在 的 意义 : 将 各 个 应 用 的 静态 文件 和 一 些 指 定 目录 中 的 
文件 ) 统 一 收集 起 来 ， 这 样 在 生产 环境 中 ， 这 些 文件 就 会 集中 于 一 个 便于 分 此 的 地 方 。 


14.7.1 上 自 定 义 应 用 表面 和 风格 


首先 , 在 polls 目录 下 创建 一 个 名 为 static 的 子 目 录 。Django 将 在 该 子 日 录 下 查找 静态 文件 ， 
这 种 方式 和 Diango 在 polls/templates/ 目 录 下 查找 模板 的 方式 类 似 。 
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Django 的 STATICFILES FINDERS 设置 包含 一 系列 的 查找 器 ， 它 们 知道 去 哪里 找到 静态 
文件 。AppDirectoriesFinder 是 默认 大 找 器 中 的 一 个 ， 它 会 在 INSTALLED_APPS 中 指定 的 每 个 
应 用 的 子 文件 中 寻找 名 为 static 的 文件 夹 ， 束 像 在 polls 目录 中 刚刚 创建 的 那个 一 样 。 管 理 后 台 
采用 相同 的 目录 结构 管理 静态 文件 。 

在 创建 的 static 文件 夹 中 创建 一 个 名 为 polls 的 子 文件 夹 , 再 在 polls 子 文件 夹 中 创建 一 个 名 
为 style.css 的 文件 。 换 名 话说， 样式 表 路 径 应 是 polls/static/polls/style.css 。 因 为 
AppDirectoriesFinder 的 存在 ,可 以 在 Django 中 简单 以 pollskstyle css 的 形式 引用 此 文件 , 类 似 引 
用 模板 路 径 的 方式 。 


14.7.2 “管理 静态 资源 


虽然 可 以 像 管 理 模板 文件 一 样 ， 把 静态 文件 直接 放 入 polls/static 中 一 一 而 不 是 创建 男 一 个 
名 为 polls 的 子 文 件 夹 ， 不 过 这 种 方式 不 太 恰 当 。Dijango 只 会 使 用 第 一 个 找到 的 静态 文件 。 如 
果 在 其 他 应 用 中 有 相同 名 字 的 静态 文件 ，Django 将 无 法 区 分 它们 。 需 要 指引 Diango 选择 正确 
的 静态 文件 ， 而 最 简单 的 方式 束 是 把 它们 放 入 各 自 的 名 称 空间 中 ， 也 就 是 把 这 些 静 态 文 件 放 入 
男 一 个 与 应 用 名 相同 的 目录 中 。 

将 以 下 代码 放 入 样式 表 (polls/static/polls/style.css): 


liaf 
color green: 


} 
下 一 步 ， 在 polls/templates/polls/index.html 的 文件 头 添 加 以 下 内 容 : 


{%% load static 9%0} 
<lnk rel="stylesheet" type="text/css" href—="{% static 'polls/style.css' %0}" /> 


{% static 9 模板 标 等 会 生成 静态 文件 的 绝对 路 径 。 

以 上 就 是 需要 做 的 全 部 事情 。 浏 览 器 重 载 http://localhost:8000/polls/， 然 后 可 以 看 到 投票 链 
接 是 绿色 的 (Django 样式 )， 这 意味 着 样式 表 被 止 确 加 载 了 。 

接着 , 创建 用 于 存放 图 像 的 目录 ,在 polls/static/polls 目录 下 创建 一 个 名 为 images 的 子 目 录 。 
在 这 个 子 目 录 中 ， 放 一 张 名 为 background.gif 的 图 片 。 换 言 之 ， 在 目录 
polls/static/polls/images/backeround.gif 中 放 一 张 图 片 。 

随后 ， 在 样式 表 (polls/static/polls/style.css) 中 添加 以 下 代码 : 

body { 

backeround: white wl("images/backeround.af") no-repeat: 
} 


浏览 器 重 载 http:Wlocalhost:8000/polls/， 可 在 屏幕 的 左上 角 见 到 这 张 背 景 图 片 。 
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有 完善 投票 管理 后 台 


本 节 将 综合 使 用 前 面 介 绍 的 知识 , 使 用 Django 自动 生成 的 管理 后 台 来 为 投票 应 用 创建 后 人 台 
管理 程序 。 
14.8.1 改变 后 台 表 单 

由 前 面 的 介绍 可 知 ， 通 过 admin siteregister(Questiom) 注 册 Question 模型 ，Django 能 够 构建 

一 个 默认 的 表单 用 于 展示 。 通常 来 说 ， 实 际 项 目 中 ， 比 较 倾 回 于 自 定 义 表 单 的 外 观 和 工作 方式 。 
开发 人 员 可 以 在 注册 模型 时 将 这 些 设 置 告 诉 Django。 

下 面 通过 重 排 表单 上 的 字段 来 看 看 表单 是 怎么 工作 的 。 首 先 ， 用 以 下 内 容 蔡 换 
admin .site.register(Question): 


#polls/admin.py 
from djaneo.contrib import admm 
from .models 1mport Question 


class Question Admm(admm.ModelAdmm): 
fields = [pub date', 'question text | 


在 需要 修改 模型 的 后 台 管 理 选 项 时 ， 开 发 人 员 可 按照 以 下 步骤 来 实现 : 首先 创建 一 个 模型 
后 人 台 类 ， 然 后 将 其 作为 第 二 个 参数 传 给 admin_.site Tegister0O。 
这 样 修改 后 ，Date published 字段 显示 在 Question text 字段 之 前 ， 如 图 14-11 所 示 。 


Home ; Polls ; Questions ; What's new?Ah? 


Change question HISTORY 


Date published: Date. 2019-02-13 Today| 湖 


Time: O03:42:04 Now | 全 


Question text: What's new?Ah? 


Save and add another 国 Save and continue editing 


图 14-11 字段 显示 


这 在 只 有 两 个 字段 时 显得 没什么 用 ， 但 对 于 拥有 数 十 个 字段 的 表单 来 说 ， 根 据 字 段 使 用 频 
次 来 安排 显示 顺序 ， 对 提升 工作 效率 显得 尤为 重要 。 

显示 大 量 字 段 时 ， 除 了 显示 顺序 之 外 ， 显 示 布 局 也 尤为 重要 。 用 户 可 能 更 期 望 将 表单 分 为 
几 个 字段 集 ， 以 便于 管理 操作 : 


#pDollsadmimn.py 
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from djaneo.contrib Import admim 
from .models Import Question 


class QuestionAdmm(admm. 
fieldsets = [ 
(None, {fields': [question text|}), 
(Date mformation'. {fields': [pub date'|}). 


| 
admm.site.register(Question, QUestionAdmin) 
fieldsets 元 组 中 的 第 一 个 元 素 是 字段 集 的 标题 ,运行 管理 后 人 台 , 看 到 的 表单 如 图 14-12 所 示 。 


Home ; Polls ; Questions ; What's up? 


Change question 


Question text: 


Date: 2015-09-06 Today 


Time: 21:16:20 Now | OO 


图 14-12 表单 布局 的 调整 效果 


问题 和 选项 数据 通过 外 键 关联 。 但 在 上 面 的 管理 界面 中 ， 两 者 没有 任何 映射 ， 这 样 的 显示 
方式 ， 在 管理 员 管 理 信 息 时 ， 是 很 容易 填 错 的 ， 也 很 不 方便 。 下 面 为 Question 和 Choice 对 象 添 
加 关联 。 

有 两 种 方法 可 以 解决 这 个 问题 。 第 一 种 就 是 仿照 回 后 台 注 册 Question 对 象 一 样 注册 Choice 
对 象 。 这 种 方法 很 简单 ， 程 序 如 下 : 

#Dollsadmin.py 

from django.contrb Import admm 


from .models 1mport Choice, Question 

admm.site.reglster(Choice) 

此 时 Choice 对 象 在 Django 后 台 界 面 中 就 是 可 用 的 选项 了 。“ 添 加 选项 ”表单 如 图 14-13 
所 示 。 
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Home ; Polls ; Choices ; Add choice 


Add CHOICE 


Question: 


Choice text: 


Votes: 


Save and continue editing 


图 14-13 “添加 选项 ”表单 


在 这 个 表单 中 ，Question 字段 是 一 个 包含 数据 库 中 所 有 投票 的 选择 框 。Django 知道 要 将 外 
键 在 后 台中 以 选择 框 的 形式 展示 。 此 时 只 有 一 个 投票 。 

同时 ， 注 意 Question 劳 边 的 “添加 ”按钮 (+)， 每 个 使 用 外 键 关 联 到 为 一 个 对 象 的 对 象 会 
自动 获得 这 个 功能 。 当 单 击 “ 添 加 ”(+) 按 钮 时 ， 可 以 看 到 一 个 包含 “添加 投票 ”功能 的 表单 。 
如 果 在 这 个 选择 框 中 添加 一 个 投票 ， 并 单 击 SAVE 按钮 ，Django 会 将 其 保存 至 数据 库 ， 并 动态 
地 在 当前 的 “添加 选项 ”表单 中 选中 它 。 

不 过 ， 这 是 一 种 很 低 效 的 添加 “选项 ”的 方法 。 更 好 的 方法 是 在 创建 “投票 ”对 象 时 直接 
添加 几 个 选项 。 下 面 来 实现 。 

移 除 通过 调用 register0 来 注册 Choice 模型 的 代码 。 随 后 ， 如 下 修改 Question 模型 的 注册 
代码 : 

#polls/admimn.py 

from djanego.contrib Import admm 

from .models Import Cholce. Question 


class Choicelnime(admmn.StackedInlme): 
model = Choice 
exXtra 三 了 


class QuesttonAdnmin(admin.ModelAdnmin): 
fieldsets = [ 
(None, {fields': ['question text|}). 
(Date mformation', {fields': [pub date'], 'classes': ['collapse'|}). 
mlmes = [ChoiceInlme| 


adnmun.site.register(Question, QuestionAdmin) 

以 上 程序 告诉 Django: Choice 对 象 要 在 Question 后 台 界面 编辑 , 默认 提供 3 个 足够 的 选项 
字段 。 

运行 程序 ， 在 后 台 管 理 界面 中 ， 打 开 “ 添 加 投票 ”页 面 ， 如 图 14-14 所 示 。 
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Hormes Polls， Questions ; Add question 


Add question 


Question text: 


Date informatioen 


Date published: 


CHOICES 


Chaiee: #1 


Choice text: 


Votes: 


Choiee: #2 


Choice text: 


Votes: 


Choice: #3 


Choice text: 


Votes: 


图 14-14 “添加 投票 ”页 面 
此 时 “添加 投票 ”页 面 有 三 个 关联 的 插 槽 一 一 由 extra 定义 , 日 每 次 返回 己 创 建 的 任意 对 象 
的 “修改 ”页 面 时 ， 可 以 看 到 3 个 新 的 插 槽 。 
在 3 个 插 权 的 下 面 ， 可 以 看 到 “添加 新 选项 ”(Add another Choice) 按 钮 。 单 击 后 ， 将 添加 
一 个 新 的 插 槽 。 如 果 要 移 除 已 有 的 插 槽 ， 可 以 单 击 插 槽 在 上 角 的 电 按 钮 ， 但 是 不 能 移 除 原始 的 
3 个 插 槽 。 


示 所 有 关联 的 Choice 对 象 的 字段 。 对 于 这 个 问题 ，Django 提供 了 一 种 表格 式 的 单行 显示 关联 
对 象 的 方法 。 只 需要 按 如 下 形式 修改 ChoiceInline 声明 即 可 : 


class ChoiceInlime(admm.TabularInlme): 
#.. 


通过 用 TabularInline 蔡 代 StackedInline， 关 联 对 象 以 一 种 表格 形 方式 展示 ， 显 得 更 加 紧凑 ， 
效果 如 图 14-15 所 示 。 
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CHOICES 


CHOICE TEXT DELETE? 


Add ancther Choice 


Save and add another Save and continue editing SAWE 


图 14-15 修改 后 的 “添加 选项 ”表单 


注意 ， 这 里 有 和 额外 的 “DELETE?” 列 ， 这 允许 移 除 通 过 “添加 新 选项 ”(Add another Choice) 
按钮 添加 的 或 是 已 保存 的 数据 记录 。 


14.8.2 ”改变 字段 列表 


现在 投票 应 用 的 后 台 界 面 看 起 来 很 不 错 ， 下 面 再 对 “更 改 列表 ”页 面 进行 一 些 调整 一 一 改 
成 一 个 能 展示 系统 中 所 有 投票 的 页 面 。 

默认 情况 下 ， 管 理 后 台 的 “更 改 列 表 ” 页 面 只 显示 一 个 字段 ， 也 就 是 每 个 对 象 的 str0 方 法 
返回 的 值 。 但 有 时 如 果 能 够 显示 多 个 字段 ， 它 会 更 有 帮助 。 为 此 ， 使 用 list_ display 选项 ， 指 定 
一 个 包含 要 显示 的 字段 名 的 元 组 ， 在 “更 改 列表 ”页 面 中 以 列 的 形式 展示 这 个 对 象 ， 这 非常 有 
用 。 示 例 代 码 如 下 : 


#polls/admimn.py 
class QuestionAdmm(admun.NModelAdmm): 
i# 


J = (question text', Pub date’) 


为 了 更 好 用 ， 下 面 再 使 用 前 面 介绍 过 的 was_published_recently0 方 法 : 


class QuestionAdmin(admin.Model Admin): 
#... 


list dsplay = (question text' pub date', was published recently’) 
运行 程序 ， 现 在 投票 应 用 的 “更 改 列表 ”页 面 如 图 14-16 所 示 。 


Home: Pells: Ouestions 


Select question to change 


BEtON: | === 


| QUESTION TEXT DATE PUBLISHED WAS PUBLISHED AECENTLY 


司 Wharts new?Ah? Feb. 13, 2019. 3-42 a.m. False 


1 guestion 


图 14-16 显示 多 个 字段 
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这 时 可 以 单 击 列 标题 来 对 这 些 行进 行 排序 一 一 除了 was_published recently 列 ， 因 为 没有 实 
现 排序 方法 .顺便 看 下 该 列 的 标题 was published recently, 默认 就 是 方法 名 (用 空格 替换 下 夯 线 )， 
该 列 的 每 行 都 以 字符 串 形式 展示 出 处 。 
可 以 通过 给 这 个 方法 (polls/models.py) 添 加 一 些 属性 来 达到 优化 页 面 的 目的 ， 代 码 如 下 : 
#polls/models.py 
class Question(models.Model): 
入 2 
def was published recently(self): 
now = timezone.now!() 
Tetum now - datetime.timedelta(days=]1) <—= selt.pub date <= now 
was published recently.admm order field= pub date' 
was published recently.boolean = True 
Was published recently.short description = Publlished recently? 


下 面 再 来 编辑 文件 polls/admin.py; 优化 “问题 编辑 ”页 面 中 的 过 滤器 ,可 通过 使 用 list_filter 
来 实现 。 将 以 下 代码 添加 人 至 QuestionAdmin 类 : 


list filter = [pub date'] 
上 面 添 加 了 “过 滤器 ” (FILTER) 侧 边栏 ， 人 允许 管 理 员 以 pub date 字段 过 滤 列 表 , 如 图 14-17 
所 示 。 


Home : Polls ; OQuestions 


Select question to change 
| FILTER 
Betihem | ===-==--=- Dol 1 selected 


By date published 
国 。 UEsTION TEXT DATE PUBLISHED PUBLISHED RECENTLY3 

hriy date 
DD What's new?Ah? Feb. 13, 2019, 3:42 a.m. © oy 


Pe I 
1 guestion This monmth 
下 


14-17 添加 过 滤器 
图 14-17 中 展示 的 过 滤器 类 型 取决 于 要 过 滤 的 字段 类 型 。 因 为 pub_date 是 DateTimeField 
类 的 实例 ，Django 知道 要 提供 哪个 过 滤器 : “任意 时 间 ”(Any date)、“ 今 天 ”(Today)、“ 过 
去 7 天 ”(Past7 days)、“ 这 个 月 ”(This month) 和 “今年 ”(This year)。 
现在 管理 界面 的 体验 已 经 足够 好 了 。 下 面 再 来 扩充 搜索 框 ， 以 免 数据 量 大 时 碍 找 数 据 记 录 
不 方便 。 扩 充 搜索 框 可 通过 search fields 实现 : 
search fields = ['question text | 


在 列表 的 顶部 增加 一 个 搜索 框 。 当 输入 待 搜 项 时 ，Dijango 将 搜索 question text 字段 。 可 以 


使 用 任意 多 个 字段 一 一 由 于 后 台 使 用 LIKE 得 询 数据 ， 对 行 搜索 的 字段 数 进 行 限制 为 ， 以 便于 
对 数据 库 进 行 查 询 操作 。 


除了 以 上 功能 外 ， 还 可 以 给 “问题 编辑 页 面 ”增加 分 页 功能 ， 指 定 每 页 默认 显示 的 记录 条 
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数 、 默 认 的 变更 页 分 页 行为 ， 等 等 。 感 兴趣 的 同学 可 以 多 加 思考 ， 阅 读 相 关 资 料 并 动手 练习 。 
14.8.3 ”改变 后 台 再 面 和 风格 


在 前 面 的 管理 界面 中 可 以 看 到 , 在 每 个 后 台 页 面 的 顶部 显示 “Django 管理 员 ” 显 得 很 滑 重 。 
这 只 是 一 串 占 位 符 。 

不 过 ， 这 可 以 通过 Django 的 模板 系统 方便 地 进行 修改 。Django 的 后 台 由 上 自己 驱动 ， 且 交 
互 接 口 采 用 Django 目 己 的 模板 系统 。 


1. 目 定 义 项 目 模 板 


在 项 目 目录 (包含 managepy 的 那个 文件 严 ) 内 创建 一 个 名 为 templates 的 子 日 录 。 模 板 可 放 
在 系统 中 Django 能 找到 的 任何 位 置 。 谁 月 动 了 Django，Django 束 以 其 用 户 号 份 运行 。 不 过 ， 
建议 把 模板 放 在 项 目 中 ， 这 可 以 带 来 很 大 便利 。 

打开 设置 文件 pyqi/settingspy， 在 TEMPLATES 设置 中 添加 DIRS 选项 : 


#pyqysettngs.py 
TEMPLATES =| 
ft 
‘BACKEND:': "django.template.backends.django.DlaneoTemplates, 
DIRS': [os.path.jJom(BASE DIR., templates')|, 
‘APP DIRS: lmue, 
'OPTIONS' { 
'context processors': [ 
'djaneo.template.context processors.debug'. 
‘django.template.context processors.request., 
‘django.contrib.auth.context processors.auth'. 
'djaneo.contnb.messages.context processors.messages, 


] 
DIRS 是 一 个 包含 多 个 系统 目录 的 文件 列表 ， 用 于 在 载 入 Django 模板 时 使 用 ， 是 符 搜 索 


2. 组 织 模 板 


号 像 静态 文件 一 样 ， 可 以 把 所 有 的 模板 文件 放 在 一 个 大 的 模板 目录 内 ， 这 样 也 能 工作 得 很 
好 。 但 是 ， 属 于 特定 应 用 的 模板 文件 最 好 放 在 应 用 所 属 的 模板 目录 (例如 polls/templates) 内 ， 而 
不 是 放 在 项 目的 模板 目录 (templates) 内 。 

现在 ， 在 templates 目录 内 创建 名 为 admin 的 子 目录 ， 随 后 ， 将 存放 Django 默认 模板 的 目 
录 (django/contrib/admin/templates) 内 的 模板 文件 admin/base_site.html 复制 到 这 个 子 目 录 内 。 

Diango 的 源 文 件 在 哪里 ? 如 果 不 知 道 Django 的 源 文件 在 系统 的 哪个 位 置 ， 可 以 运行 以 下 


A 
HD 令 : 
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$python -c "Import django: print(djanego. path )" 
接着 ， 用 站 点 的 名 字 蔡 换文 件 内 的 {f site headerldefault (Django administration") } (包含 花 
括号 )。 完 成 后 ， 应 该 可 以 看 到 如 下 代码 : 


{%0 block brandine %} 
<hl 1d=—"site-name"><a href—="{% url admlinindex %}">Polls Admmmstraion</a><Jh1> 
{%0 endblock "0} 


在 真实 项 目 中 , 可 能 更 期 望 修改 现 有 的 django.contrib.admin.AdminSite.site header 来 进行 向 
单 定制 ， 降 低 成 本 。 

这 个 模板 文件 包含 很 多 类 似 {% block branding %} 和 {{ title 小 的 文本 。{% 和 和 标签 是 
Django 模板 语言 的 一 部 分 。 当 Django 泻 染 admin/base_site.html 时 ， 这 种 模板 语言 会 被 求 值 ， 
生成 最 终 的 网 页 。 

注意 ， 所 有 的 Django 默认 后 台 模 板 均 可 修改 。 要 复写 模板 ， 像 修改 base_site.html 一 样 修 
再 做 修改 。 


打包 和 发 布 投票 系统 


可 重用 性 很 重要 。 设 计 、 构 建 、 测 试 以 及 维护 一 个 Web 应 用 要 做 很 多 工作 。 很 多 Python 
和 Dijango 项 目 都 有 一 些 常见 问题 。 如 果 能 保存 并 利用 这 些 重复 的 工作 ， 岂 不 更 好 ? 


14.9.1 复 用 的 重 归 性 


一 个 项 目 开 发 完毕 后 ， 为 了 最 大 程度 上 提升 应 用 价值 ， 往 往 将 应 用 安装 到 不 同 的 项 目 中 ， 
供 不 同 的 项 目 使 用 。 本 节 将 会 把 投票 应 用 polls 放 进 一 个 独立 的 Python 包 ， 以 便 在 新 的 项 目 中 
重用 或 与 他 人 分 享 。 

可 重用 性 是 Python 的 生存 方式 。 Python 软件 包 索 引 (PyPD 有 很 多 可 以 在 Python 程序 中 使 用 
的 软件 包 。 查 看 Django Packages 以 了 解 可 以 整合 到 项 目 中 的 现 有 可 重用 应 用 。Django 本 身 也 
只 是 一 个 Python 包 , 这 意味 着 可 以 将 现 有 的 Python 包 或 Django 应 用 组 合 到 上 自己 的 Web 项 目 中 。 
只 需要 编写 项 目 中 独一无二 的 部 分 即 可 。 


14.9.2 ”打包 项 目 和 应 用 


假设 创建 了 一 个 新 的 项 目 ,并 且 需 要 一 个 类 似 之 前 做 的 投票 应 用 。 该 如 何 复 用 这 个 应 用 呢 ? 
庆 辫 的 是 ， 其 实 同学 们 已 经 知道 了 一 些 。 在 前 面 的 学 习 中 ， 我 们 使 用 include 从 项 目 级 别 的 
URLconf 分 隔 出 polls。 下 面 将 进一步 使 这 个 应 用 更 容易 用 于 新 的 项 目 中 ， 并 发 布 给 其 他 人 安装 
使 用 。 

Django 中 ， 包 提供 了 一 组 关联 的 Python 代码 的 简单 复 用 方式 。 包 (“模块 ”) 包 含 一 个 或 多 
个 Python 代码 文件 。 

包 通 过 import foo.bar 或 from foo import bar 的 形式 导入 。 目录 (例如 polls) 要 成 为 包 , 就 必须 
包含 特定 的 文件 init py， 即便 这 个 文件 是 空 的 。 
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Django 应 用 仅仅 是 专用 于 Django 项 目的 Python 包 。 应 用 会 按照 Django 约定 ， 创 建 好 
models、tests、urls、views 等 子 模块 。 
通过 前 面 投票 系统 的 开发 过 程 ， 此 时 项 目 目录 看 起 来 应 该 像 下 面 这 样 : 


pyqy 
Manase.py 
pyqy 
_ mt py 
settings.py 
urls.py 
WseLpy 
polls/ 
mt py 
admm.py 
miegrations/ 
_ mt py 
0001 mitial.py 
models.py 
static/ 
polls/ 
1mages/ 
backeround.gt 
style.css 
templates/ 
polls/ 
detall html 
Index.html 
results.html 
tests.py 
urls.py 
VIEWS.PVY 
templates/ 
admm/ 
base site.html 
1 


目录 polls 现在 可 以 被 拷贝 至 一 个 新 的 Django 项 目 ， 且 立刻 被 复 用 。 不 过 现在 还 不 是 发 布 
它 的 时 候 。 为 了 这 样 做 ， 需 要 打包 这 个 应 用 ， 以 便于 其 他 人 安装 。 

首先 搭建 必需 的 环境 。 目 前 ， 打 包 Python 程序 需要 的 工具 中 ， 有 许多 工具 可 以 完成 此 项 工 
作 。 本 节 将 使 用 setuptools 来 打包 程序 。 这 是 推荐 的 打包 工具 。 可 以 使 用 pip 来 安装 和 卸载 这 个 
工具 。 

安装 打包 工具 后 , 就 可 以 开始 打包 应 用 了 。 Python 中 的 打包 将 以 一 种 特殊 的 格式 组 织 应 用 ， 
意 在 方便 安装 和 使 用 应 用 。Diango 本 身 就 被 打包 成 类 似 的 形式 。 对 于 小 的 应 用 ,例如 polls， 这 
不 会 太 难 。 

首先 在 项 目 目录 外 创建 一 个 名 为 django-polls 的 文件 夹 ， 用 于 存放 polls 应 用 。 
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然后 为 应 用 选择 名 字 。 当 为 包 选 择 名 字 时 ， 避 免 使 用 PyPI 这 样 已 存在 的 包 名 ， 否 则 会 导致 
冲突 。 当 创建 发 布 包 时 ， 可 以 在 模块 名 前 增加 django- 前 缀 ， 这 是 一 种 很 利用 也 十 分 有 用 的 避免 
包 名 冲突 的 方法 ， 同 时 也 有 助 于 他 人 在 寻找 Django 应 用 时 确认 应 用 是 Django 独 有 的 。 

应 用 标签 (用 点 分 隔 的 包 名 的 最 后 一 部 分 ) 在 INSTALLED APPS 中 必须 是 独一无二 的 。 避 
免 使 用 任何 与 Django contrib packages 文档 中 相同 的 标签 名 ， 比 如 auth、admin、messages。 

接 下 来 将 polls 目录 移入 django-polls 目录 , 创建 一 个 名 为 django-polls/README.rst 的 文件 ， 
内 容 如 下 : 


django-polls/README.rst 


Polls 


Polls 1s a simple Djaneo app to conduct Web-based polls. For each 
question, visitors can choose between a fixed number of answers. 


Detalled documentation ls In the "docs" directory. 


Quick start 


1. Add "polls" to your INSTALLED APPS settng like this:: 
INSTALLED APPS=| 


polls. 
] 


2. Include the polls URLcont m your prolect urls.py like this:: 
path('polls/, mclude(‘polls.urls")). 
3. Run ‘python manapge.py mierate’ to create the polls models. 


4. Start the development server and visit http://127.0.0.1:8000/admm/ 
to create a poll (youll need the Admun app enabled). 


3. V1sit http://127.0.0.1:8000/polls/ to participate m the poll. 


创建 django-polls/LICENSE 文件 。 选 择 非 本 书 使 用 的 授权 协议 ， 但 需要 足以 说 明 发 布 代码 
没有 授权 证 书 是 不 可 能 的 。 Django 和 很 多 兼容 Django 的 应 用 是 以 BSD 授权 协议 发 布 的 ; 不 过 ， 
可 以 自己 选择 授权 协议 。 

创建 setup.py 用 于 说 明 构 建 和 安装 应 用 的 细节 。 对 该 文件 的 完整 介绍 超出 了 本 书 的 讨论 范 
图， 但 是 setuptools 文档 中 有 详细 的 介绍 。 创 建文 件 django-polls/setup.py， 使 之 包含 以 下 内 容 : 


Inport os 
from setuptools Import find packages, setup 


with open(os.path.jom(os.path.dimame( flle ),'README.rst)) as Teadme: 
README = readme .read() 


# allow setup.py to be run from any path 
os.chdr(os.path.normpath(os.path.jom(os.path.abspath( 如 je ),os.pardxr))) 


setup( 
name='djaneo-polls', 
verslon—0.1", 
packages—find packages(). 
include packapge data=True, 
license=BSD License', # example license 
description='A simple Djaneo app to conduct Web-based polls.", 
lone description~=README, 
url=https://Wwww.example.com/, 
author="Y our Name.. 
author email=youmame(Vexample.com., 
classifiers—[ 
Environment :: Web Environment. 
Framework :: Djaneo. 
Framework :: Djanego :: X.Y, #replace "X.Y" as appropriate 
TIntended Audience :: Developers, 
License :: OSI Approved :: BSD License'’, #example license 
‘Operating System :: OS Independent. 
‘Proerammme Laneuage :: Python '， 
‘Programmine Laneuage :: Python :: 3.5,, 
‘ProsTrammine Laneuape :: Python :: 3.6， 
"Topic :: Intemet :: WWW/HTTP, 
Topic :: Intemet :: WWW/HTTP :: Dynamlc Content, 


) 


默认 包 中 只 包含 Python 模块 和 包 。 为 了 包含 额外 文件 ， 需 要 创建 一 个 名 为 MANIFEST.in 
的 文件 。 刚 才 关 于 setuptools 的 文档 详细 介绍 了 这 个 文件 。 为 了 包含 模板 、README .rst 和 
LICENSE 文件 ， 创 建文 件 django-polls/MANIFEST.in， 内 容 如 下 : 


djaneo-polls/MANIFEST.m 
mclude LICENSE 

mnclude README rst 
recursive-include polls/static * 
recursive-include polls/templates * 


在 应 用 中 包含 详细 文档 是 可 选 的 ， 但 建议 这 样 做 。 创 建 空 目录 django-polls/docs 用 于 未 来 
编写 文档 。 额 外 添加 一 行 至 django-polls/MANIFEST in: 
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TectUrsIVe-lnclude docs * 


注意 ， 现 在 docs 目录 不 会 被 加 入 应 用 包 ， 除 非 往 这 个 目录 中 添加 几 个 文件 。 许 多 Diango 
应 用 也 通过 类 似 readthedocs.ore 这 样 的 网 站 提供 在 线 文 档 。 

试 痢 通过 ptyhon setup.py sdist( 在 django-polls 目录 内 ) 构 建 应 用 包 ， 这 将 创建 一 个 名 为 dist 
的 目录 并 构建 应 用 包 django-polls-0.1.tar.gz。 


14.9.3 ”安装 和 知 载 自 定义 包 


前 面 由 于 把 polls 目录 移出 了 项 目 , 因此 项 目 无 法 工作 。 现在 需要 通过 安装 新 的 django-polls 
应 用 来 修复 这 个 问题 。 有 以 下 两 种 安装 方式 。 

以 下 步骤 将 django-polls 以 用 户 库 的 形式 安装 。 与 安装 整个 系统 的 软件 包 相 比 ， 这 种 安装 具 
有 许多 优点 ， 例 如 可 在 没有 管理 员 访 问 权 的 系统 中 使 用 ， 以 及 防止 应 用 包 影 响 系 统 服务 和 其 他 
用 户 。 

注意 ， 这 种 安装 仍然 会 影响 以 用 户 身 份 运 行 的 系统 工具 ， 所 以 _virtualenv 是 一 种 更 强大 的 
解决 方案 。 

为 了 安装 django-polls， 可 使 用 pip 进行 安装 : 


pip mstall -user djaneo-polls/dist/djaneo-polls-0.1.tar.ez 


外 运 的 话 ，Django 项 目 应 该 再 一 次 正确 运行 。 可 局 动 服务 器 确认 这 一 点 。 
如 果 不 需 要 了 ， 可 以 通过 pip 凶 载 dango-polls。 命 令 如 下 : 


pip unmstall django-polls 
以 用 户 库 的 形式 安装 投票 应 用 有 以 下 缺点 ， 修 改 用 户 库 会 影响 系统 中 的 其 他 Python 软件 ， 


用 户 将 不 能 运行 此 包 的 多 个 版 本 (或 者 其 他 用 有 相同 包 名 的 包 )。 一 般 来 说 ， 这 些 状 况 只 在 同时 
运行 多 个 Django 项 目 时 出 现 。 当 这 个 问题 出 现时 ， 最 好 的 解决 办 法 是 使 用 虚拟 环境 工具 
virtualenv。 这 个 工具 允许 同时 运行 多 个 相互 独立 的 Python 环境 ， 每 个 环境 都 有 各 自 库 和 应 用 包 
所 在 名 称 空 间 的 副本 。 
14.9.4 ”发 布 包 

现在 ， 大 家 已 经 对 django-polls 完成 了 打包 和 测试 , 接 下 来 可 以 同 他 人 分 享 自 己 的 包 了 。 大 


家 可 以 通过 邮件 将 包 发 送 给 朋友 ; 可 以 将 包 上 传 至 自己 的 网 站 ; 还 可 以 将 包 发 布 全 公共 仓库 ， 
比如 Python Package Index (PyPD， 可 参考 packaging python.org 来 学 习 如 何 发 布 包 至 公共 仓库 。 


本 章 小 结 


Django 是 使 用 Python 开发 Web 应 用 时 用 得 最 多 的 Web 框架 ,也 是 Python 中 的 重量 级 Web 
框架 。 本 章 结 合 一 个 投票 管理 系统 的 创建 过 程 ， 详 细 讲 解 了 Django 框架 的 使 用 。 

首先 介绍 的 是 Web 框架 和 Django 框架 。 接 着 使 用 Django 框架 创建 了 项 目 pyqi， 并 在 pygqi 
项 目下 创建 投票 管理 系统 polls 另外 简单 介绍 了 所 生成 项 目 和 应 用 的 目录 结构 。 
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接着 ， 为 pyqi 项 目 配 置 数 据 库 连 接 信息 ， 为 投票 管理 系统 创建 模型 、 激 活 模型 、 生 成 需要 
的 数据 库 表 ， 并 将 用 到 的 模型 添加 到 管理 界面 以 方便 管理 。 

然后 ， 完 善 投票 应 用 的 视图 ， 内 容 包括 为 投票 管理 系统 编 与 视图、 为 视图 添加 模板 、 谊 染 
模板 、 受 当 处 理 404 错误 、 为 应 用 使 用 模板 、 为 URL 添加 名 称 空间 ， 等 等 。 

紧 接 着 为 投票 应 用 定制 表单 ， 管 理 用 到 的 静态 资源 ， 定 义 和 完 善 投 票 管理 系统 。 

最 后 简单 介绍 了 如 何 打包 和 发 布 投票 管理 系统 。 


思考 与 练习 


建 应 用 、 es 配置 URL、 模型 、 视图 、 模板 、 je We 、 打 和 关机 本 。 
2. 尝试 用 Django 框架 开发 一 个 Web 项 目 。 
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